Atšķirība starp datu ieguvi un OLAP

Atšķirība starp datu ieguvi un OLAP
Atšķirība starp datu ieguvi un OLAP

Video: Atšķirība starp datu ieguvi un OLAP

Video: Atšķirība starp datu ieguvi un OLAP
Video: Palielinās plaisa starp darba samaksu vīriešiem un sievietēm 2024, Novembris
Anonim

Datu ieguve pret OLAP

Gan datu ieguve, gan OLAP ir divas no izplatītākajām biznesa informācijas (BI) tehnoloģijām. Biznesa informācija attiecas uz datorizētām metodēm, lai identificētu un iegūtu noderīgu informāciju no biznesa datiem. Datu ieguve ir datorzinātņu joma, kas nodarbojas ar interesantu modeļu iegūšanu no lielām datu kopām. Tas apvieno daudzas metodes no mākslīgā intelekta, statistikas un datu bāzes pārvaldības. OLAP (tiešsaistes analītiskā apstrāde), kā norāda nosaukums, ir vairāku dimensiju datu bāzu vaicājumu veidu apkopojums.

Datu ieguve ir pazīstama arī kā Knowledge Discovery in Data (KDD). Kā minēts iepriekš, tā ir datorzinātņu joma, kas nodarbojas ar iepriekš nezināmas un interesantas informācijas ieguvi no neapstrādātiem datiem. Pateicoties eksponenciālajam datu pieaugumam, īpaši tādās jomās kā uzņēmējdarbība, datu ieguve ir kļuvusi par ļoti svarīgu līdzekli, lai šo lielo datu bagātību pārvērstu biznesa inteliģencē, jo pēdējo desmitgažu laikā modeļu manuāla iegūšana ir kļuvusi šķietami neiespējama. Piemēram, pašlaik to izmanto dažādām lietojumprogrammām, piemēram, sociālo tīklu analīzei, krāpšanas atklāšanai un mārketingam. Datu ieguve parasti nodarbojas ar šādiem četriem uzdevumiem: klasterēšana, klasifikācija, regresija un asociācija. Klasterizācija ir līdzīgu grupu identificēšana no nestrukturētiem datiem. Klasifikācija ir mācīšanās noteikumi, ko var piemērot jauniem datiem, un tie parasti ietver šādas darbības: datu pirmapstrāde, modelēšanas projektēšana, mācīšanās/funkciju atlase un novērtēšana/validācija. Regresija ir funkciju atrašana ar minimālu kļūdu modelēšanai. Un asociācija meklē attiecības starp mainīgajiem. Datu ieguve parasti tiek izmantota, lai atbildētu uz jautājumiem, piemēram, kādi ir galvenie produkti, kas varētu palīdzēt gūt lielu peļņu nākamajā gadā Wal-Mart.

OLAP ir sistēmu klase, kas sniedz atbildes uz daudzdimensiju vaicājumiem. Parasti OLAP izmanto mārketingam, budžeta veidošanai, prognozēšanai un līdzīgām lietojumprogrammām. Pats par sevi saprotams, ka OLAP izmantotās datu bāzes ir konfigurētas sarežģītiem un ad hoc vaicājumiem, paturot prātā ātru veiktspēju. Parasti matricu izmanto, lai parādītu OLAP izvadi. Rindas un kolonnas veido vaicājuma izmēri. Viņi bieži izmanto apkopošanas metodes vairākās tabulās, lai iegūtu kopsavilkumus. Piemēram, to var izmantot, lai uzzinātu par šī gada pārdošanas apjomiem Wal-Mart salīdzinājumā ar pagājušo gadu? Kādas ir prognozes par pārdošanas apjomu nākamajā ceturksnī? Ko var teikt par tendenci, aplūkojot procentuālās izmaiņas?

Lai gan ir acīmredzams, ka datu ieguve un OLAP ir līdzīgas, jo tās darbojas ar datiem, lai iegūtu informāciju, galvenā atšķirība izriet no tā, kā tie darbojas ar datiem. OLAP rīki nodrošina daudzdimensionālu datu analīzi un nodrošina datu kopsavilkumus, taču pretēji tam datu ieguve koncentrējas uz attiecībām, modeļiem un ietekmi datu kopā. Tas ir OLAP darījums ar apkopošanu, kas ir saistīts ar datu darbību, izmantojot “pievienošanu”, bet datu ieguve atbilst “dalīšanai”. Vēl viena ievērojama atšķirība ir tāda, ka, lai gan datu ieguves rīki modelē datus un atgriež izpildāmus noteikumus, OLAP reāllaikā veiks salīdzināšanas un kontrastēšanas metodes atbilstoši biznesa dimensijai.

Ieteicams: