| Dėmesio! Straipsnis ar jo dalis neturiišnašų į patikimus šaltinius. Dėl to medžiaga gali būti nepatikima. Pagal Vikipedijos nuostatas,nepatikrinama informacija gali būti trinama. Paieškokitepatikimų šaltinių ir paremkite medžiagąišnašomis į šaltinius. |
Klasifikavimo (arba mašininio mokymosi)algoritmas –algoritmas, automatiškai suskirstantis pradinęobjektų aibę į dvi ar daugiau grupių, kuomet atrankos kriterijai nėra trivialūs.
Klasifikuodamas algoritmas remiasi galimomis nustatyti objektų savybėmis (angl.attributes). Kiekviena savybė turi vardą ir tipą. Savybės gali būti tolydžios (pvz., ilgis) arba diskrečios (pvz., metai). Diskrečios savybės gali būti rūšiuojamos (pvz., sėklų skaičius ankštyje) arba neturinčios akivaizdžios rūšiavimo sekos (pvz., žmogaus profesija).
Klasifikavimo algoritmui pateikiamas savybių sąrašas, jau (paprastai žmogaus) suklasifikuota „apmokymo aibe“ (angl.training set) bei vienas ar keli objektai, kurių grupė iš anksto nežinoma ir ją reikia nustatyti šiuo algoritmu. Algoritmo kokybė tikrinama jo darbe nenaudojama žinomai suklasifikuota tikrinimo aibe (angl.testing set).
Klasifikavimo algoritmai plačiai naudojami bioinformatikoje (baltymų irDNR sekoms klasifikuoti), elektroninio pašto sistemose (žinutėms rūšiuoti iršlamštui filtruoti) ir kitose srityse. Paprastai iš anksto neaišku, kuris iš daugybės žinomų algoritmų geriausiai dirbs konkrečiu atveju, todėl jie bandomi naudojant kurią nors klasifikavimo algoritmų biblioteką.