Názor k článku Špehují nás? Kdepak, ta data jim poskytujeme sami a dobrovolně od gogloid - Jako student věnující se částečně i problematice data...

  • Článek je starý, nové názory již nelze přidávat.
  • 28. 3. 2011 22:37

    gogloid (neregistrovaný)
    Jako student věnující se částečně i problematice data miningu bych rád trochu zkusil objasnit, jak vůbec takové dolování funguje:
    • máte relativně velkou sadu dat, která obsahuje "skutečnosti" a "důsledek"
    • snažíte se najít souvislosti mezi těmito "skutečnostmi" a "důsledkem"
    S počítači to dostává grády, protože se tohle hledání souvislostí dá dělat více méně automaticky (existují na to algoritmy).

    Zde je důležité si uvědomit jednu věc - musíte předem mít (předpřipravená) data (ty není až takový problém získat; stačí je jen upravit do nějaké rozumné podoby) a taky musíte mít ten *důsledek*. To jest data mining neumí jen z dat odvodit důsledky. Proto mohl MasterCard zjistit, že se rozvádíte - protože přišel na to, že někteří lidé, kteří třeba neměli problém s placením, najednou problém mají, a tak zjišťovali proč. Když zjistili, že je tam velké zastoupení těch rozvádějících se, zkusili daná data nechat automaticky zanalyzovat a voila, jsou schopni i na dalších datech (= u dalších lidí) zjistit, jestli se rozvádí. (Aneb vítejte ve světě strojového učení)

    To, co se ve článku popisuje jako data mining, je něco trochu jiného - velmi pravděpodobně se jedná jen o prohledávání více či méně dostupných databází, nikoliv již tak automatické vyvozování znalostí a zkušeností. Bohužel si pro toto nedovedu nedovedu představit jiný pojem než právě data mining...

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).