�(dú)熱編碼(One-Hot Encoding),也叫一位有效編�,是用來(lái)表示離散變量(categorical data)的一種方法。在�(jī)器學(xué)�(xí)和深度學(xué)�(xí)中經(jīng)常會(huì)使用�(dú)熱編碼來(lái)將離散變量轉(zhuǎn)換為多維向量,以便于算法處理�
�(dú)熱編碼是指將離散型的特征�(shù)�(jù)映射到一�(gè)高維空間中,每�(gè)可能的取值都�(duì)�(yīng)于高維空間的一�(gè)�(diǎn),在這些�(diǎn)上取值為1,其余均�0,因此獨(dú)熱編碼也被稱為“一位有效編碼”或“One-of-K encoding”�
�(dú)熱編碼原理可以用以下例子�(lái)解釋:假�(shè)我們有一組汽車品牌數(shù)�(jù),包含三種品牌:Benz、BMW、Audi。使用獨(dú)熱編碼對(duì)這組�(shù)�(jù)�(jìn)行編碼后,可以得到以下結(jié)果:
汽車品牌 | �(dú)熱編� |
---|---|
Benz | [1, 0, 0] |
BMW | [0, 1, 0] |
Audi | [0, 0, 1] |
可以看到,原本三種汽車品牌的離散�(shù)�(jù)被編碼為了一組由3�(gè)元素組成的向量,每�(gè)元素的取值要么是0,要么是1�
�(dú)熱編碼的�(yōu)�(diǎn)在于�
適用于大多數(shù)算法�
避免了特征之間的大小�(guān)系干擾模型的�(xùn)練;
能夠很好地處理分類變��
�(dú)熱編碼的缺點(diǎn)在于�
�(dāng)類別�(shù)量較多時(shí),會(huì)�(dǎo)致稀疏矩陣問��
在某些應(yīng)用中,可能并不需要將所有分類都作為分開的一�(gè)特征,此�(shí)�(dú)熱編碼可能不是最�(yōu)選擇�
維庫(kù)電子�,電子知�(shí),一查百��
已收錄詞�153979�(gè)