Atšķirība starp uzraudzītu un neuzraudzītu mašīnmācīšanos

Satura rādītājs:

Atšķirība starp uzraudzītu un neuzraudzītu mašīnmācīšanos
Atšķirība starp uzraudzītu un neuzraudzītu mašīnmācīšanos

Video: Atšķirība starp uzraudzītu un neuzraudzītu mašīnmācīšanos

Video: Atšķirība starp uzraudzītu un neuzraudzītu mašīnmācīšanos
Video: Машинное обучение — контролируемое VS неконтролируемое обучение 2024, Novembris
Anonim

Galvenā atšķirība - uzraudzīta un neuzraudzīta mašīnmācīšanās

Uzraudzīta mācīšanās un neuzraudzīta mācīšanās ir divi mašīnmācīšanās pamatjēdzieni. Uzraudzītā mācīšanās ir mašīnmācīšanās uzdevums, lai apgūtu funkciju, kas kartē ievadi ar izvadi, pamatojoties uz ievades-izejas pāru piemēriem. Neuzraudzīta mācīšanās ir mašīnmācīšanās uzdevums, lai no nemarķētiem datiem izsecinātu funkciju, lai aprakstītu slēpto struktūru. Galvenā atšķirība starp uzraudzītu un neuzraudzītu mašīnmācīšanos ir tāda, ka uzraudzītā mācīšanās izmanto marķētus datus, bet neuzraudzīta mācīšanās izmanto neiezīmētus datus.

Mašīnmācība ir datorzinātņu joma, kas sniedz datorsistēmai iespēju mācīties no datiem, tos īpaši neieprogrammējot. Tas ļauj analizēt datus un paredzēt tajos esošos modeļus. Mašīnmācībai ir daudz lietojumprogrammu. Dažas no tām ir sejas atpazīšana, žestu atpazīšana un runas atpazīšana. Ir dažādi algoritmi, kas saistīti ar mašīnmācīšanos. Dažas no tām ir regresija, klasifikācija un klasterizācija. Visizplatītākās programmēšanas valodas mašīnmācības lietojumprogrammu izstrādei ir R un Python. Var izmantot arī citas valodas, piemēram, Java, C++ un Matlab.

Kas ir uzraudzīta mācīšanās?

Sistēmās, kuru pamatā ir mašīnmācīšanās, modelis darbojas saskaņā ar algoritmu. Uzraudzītajā apmācībā modelis tiek uzraudzīts. Pirmkārt, ir nepieciešams apmācīt modeli. Ar iegūtajām zināšanām tā var paredzēt atbildes turpmākajām instancēm. Modelis tiek apmācīts, izmantojot marķētu datu kopu. Ja sistēmai tiek sniegti dati, kas nav paraugi, tā var paredzēt rezultātu. Tālāk ir sniegts neliels izvilkums no populārās IRIS datu kopas.

Atšķirība starp uzraudzītu un neuzraudzītu mācīšanos_02. attēls
Atšķirība starp uzraudzītu un neuzraudzītu mācīšanos_02. attēls

Saskaņā ar iepriekš minēto tabulu par atribūtiem sauc Sepal garums, Sepal platums, Patel garums, Patel platums un Suga. Kolonnas ir pazīstamas kā funkcijas. Vienā rindā ir dati par visiem atribūtiem. Tāpēc vienu rindu sauc par novērojumu. Dati var būt skaitliski vai kategoriski. Modelim tiek doti novērojumi ar atbilstošo sugas nosaukumu kā ievadi. Kad tiek veikts jauns novērojums, modelim ir jāparedz sugas veids, kurai tas pieder.

Uzraudzītajā apmācībā ir klasifikācijas un regresijas algoritmi. Klasifikācija ir marķēto datu klasificēšanas process. Modelis izveidoja robežas, kas atdala datu kategorijas. Kad modelim tiek sniegti jauni dati, to var iedalīt kategorijās, pamatojoties uz to, kur atrodas punkts. K-Tuvākie kaimiņi (KNN) ir klasifikācijas modelis. Atkarībā no k vērtības tiek noteikta kategorija. Piemēram, ja k ir 5, ja konkrētais datu punkts ir tuvu astoņiem datu punktiem kategorijā A un sešiem datu punktiem kategorijā B, datu punkts tiks klasificēts kā A.

Regresija ir process, kurā tiek prognozēta iepriekšējo datu tendence, lai prognozētu jauno datu iznākumu. Regresijā izvade var sastāvēt no viena vai vairākiem nepārtrauktiem mainīgajiem. Prognozēšana tiek veikta, izmantojot līniju, kas aptver lielāko daļu datu punktu. Vienkāršākais regresijas modelis ir lineārā regresija. Tas ir ātrs un neprasa regulēšanas parametrus, piemēram, KNN. Ja dati parāda parabolisku tendenci, tad lineārās regresijas modelis nav piemērots.

Atšķirība starp uzraudzītu un neuzraudzītu mācīšanos
Atšķirība starp uzraudzītu un neuzraudzītu mācīšanos

Tie ir daži uzraudzītu mācību algoritmu piemēri. Parasti rezultāti, kas iegūti no uzraudzītām mācību metodēm, ir precīzāki un ticamāki, jo ievades dati ir labi zināmi un marķēti. Tāpēc iekārtai ir jāanalizē tikai slēptie modeļi.

Kas ir mācīšanās bez uzraudzības?

Nepārraudzītās mācībās modelis netiek uzraudzīts. Modelis darbojas pats par sevi, lai prognozētu rezultātus. Tas izmanto mašīnmācīšanās algoritmus, lai izdarītu secinājumus par nemarķētiem datiem. Parasti neuzraudzīti mācību algoritmi ir grūtāki nekā uzraudzīti mācību algoritmi, jo ir maz informācijas. Klasterizācija ir nekontrolētas mācīšanās veids. To var izmantot, lai grupētu nezināmos datus, izmantojot algoritmus. K-vidējā klasterēšana un uz blīvumu balstīta klasterizācija ir divi klasterizācijas algoritmi.

k-vidējais algoritms, katrai klasterim nejauši ievieto k centroīdu. Tad katrs datu punkts tiek piešķirts tuvākajam centroīdam. Eiklīda attālumu izmanto, lai aprēķinātu attālumu no datu punkta līdz centram. Datu punkti ir klasificēti grupās. Vēlreiz tiek aprēķinātas pozīcijas k centroīdiem. Jauno centroīda pozīciju nosaka visu grupas punktu vidējais lielums. Atkal katrs datu punkts tiek piešķirts tuvākajam centraīdam. Šis process atkārtojas, līdz centroīdi vairs nemainās. k-mean ir ātrs klasterizācijas algoritms, taču nav noteikta klasterizācijas punktu inicializācija. Turklāt pastāv lielas klasterizācijas modeļu variācijas, kuru pamatā ir klasteru punktu inicializācija.

Cits klasterizācijas algoritms ir uz blīvumu balstīta klasterizācija. Tas ir pazīstams arī kā uz blīvumu balstītas telpiskās klasterizācijas lietojumprogrammas ar troksni. Tas darbojas, definējot kopu kā maksimālo blīvuma savienoto punktu kopu. Tie ir divi parametri, ko izmanto klasterēšanai, pamatojoties uz blīvumu. Tie ir Ɛ (epsilons) un minimālie punkti. Ɛ ir apkaimes maksimālais rādiuss. Minimālie punkti ir minimālais punktu skaits Ɛ apkārtnē, lai definētu kopu. Šie ir daži klasterizācijas piemēri, kas ietilpst bez uzraudzības apmācībā.

Parasti rezultāti, kas iegūti no nepārraudzītiem mācību algoritmiem, nav īpaši precīzi un uzticami, jo iekārtai ir jādefinē un jāmarķē ievades dati pirms slēpto modeļu un funkciju noteikšanas.

Kāda ir līdzība starp uzraudzītu un neuzraudzītu mašīnmācīšanos?

Gan uzraudzīta, gan neuzraudzīta mācīšanās ir mašīnmācīšanās veidi

Kāda ir atšķirība starp uzraudzītu un neuzraudzītu mašīnmācīšanos?

Uzraudzīta pret neuzraudzītu mašīnmācību

Uzraudzītā mācīšanās ir mašīnmācīšanās uzdevums, lai apgūtu funkciju, kas kartē ievadi ar izvadi, pamatojoties uz ievades-izejas pāru piemēriem. Neuzraudzīta mācīšanās ir mašīnmācīšanās uzdevums, lai no nemarķētiem datiem izsecinātu funkciju, lai aprakstītu slēpto struktūru.
Galvenā funkcionalitāte
Uzraudzītās mācībās modelis paredz rezultātu, pamatojoties uz iezīmētajiem ievades datiem. Nepārraudzītā mācībā modelis paredz rezultātu bez iezīmētiem datiem, pats identificējot modeļus.
Rezultātu precizitāte
No uzraudzītām mācību metodēm iegūtie rezultāti ir precīzāki un ticamāki. Nepārraudzītu mācību metožu rezultātā iegūtie rezultāti nav īpaši precīzi un uzticami.
Galvenie algoritmi
Ir algoritmi regresijai un klasifikācijai uzraudzītajā apmācībā. Ir algoritmi klasteru veidošanai bez uzraudzības.

Kopsavilkums - uzraudzīta un neuzraudzīta mašīnmācīšanās

Uzraudzīta mācīšanās un neuzraudzīta mācīšanās ir divi mašīnmācīšanās veidi. Uzraudzītā mācīšanās ir mašīnmācīšanās uzdevums, lai apgūtu funkciju, kas kartē ievadi ar izvadi, pamatojoties uz ievades-izejas pāru piemēriem. Neuzraudzīta mācīšanās ir mašīnmācīšanās uzdevums, lai no nemarķētiem datiem izsecinātu funkciju, lai aprakstītu slēpto struktūru. Atšķirība starp uzraudzītu un neuzraudzītu mašīnmācīšanos ir tāda, ka uzraudzītai apmācībai tiek izmantoti marķēti dati, bet neuzraudzītai apmācībai tiek izmantoti nemarķēti dati.

Ieteicams: