most menj vissza a korábbi példát mutatják, 100 fő (amely magában foglalja a 40 terhes nők, a fennmaradó 60 nem terhes nők, mind a férfiak egy kövér hasa), mint terhes vagy nem terhes. A 40 terhes nő közül 30 terhes nő helyesen van besorolva, a fennmaradó 10 terhes nőt pedig a gépi tanulási algoritmus nem terhesnek minősíti. Másrészt a nem terhes kategóriába tartozó 60 ember közül 55 nem terhes, a fennmaradó 5 pedig terhes.,
ebben az esetben TN = 55, FP = 5, FN = 10, TP = 30. A zavart mátrix a következő.
mi a gépi tanulási modell pontossága ehhez az osztályozási feladathoz?,
Pontosság számát jelöli helyesen besorolt adatok esetben a száma összesen adatok esetekben.
ebben a példában a pontosság = (55 + 30)/(55 + 5 + 30 + 10 ) = 0.85 százalékban a pontosság 85% lesz.
A pontosság a legjobb intézkedés?
a pontosság nem feltétlenül jó intézkedés, ha az adatkészlet nem kiegyensúlyozott (mind a negatív, mind a pozitív osztályok eltérő számú adatpéldányt tartalmaznak)., Ezt egy példával magyarázzuk meg.
vegye figyelembe a következő forgatókönyvet: 90 egészséges (negatív) és 10 beteg van valamilyen betegségben (pozitív). Tegyük fel, hogy gépi tanulási modellünk tökéletesen besorolta a 90 embert egészségesnek, de az egészségtelen embereket is egészségesnek minősítette. Mi fog történni ebben a forgatókönyvben? Nézzük meg a zűrzavar mátrixot és derítsük ki a pontosságot?
ebben a példában TN = 90, FP = 0, FN = 10 és TP = 0. A zavart mátrix a következő.,
a pontosság ebben az esetben (90 + 0)/(100) = 0.9 százalékban a pontosság 90 %.
van valami gyanús?
a pontosság ebben az esetben 90%, de ez a modell nagyon rossz, mert mind a 10 egészségtelen ember egészségesnek minősül., Ezzel a példával azt próbáljuk mondani, hogy a pontosság nem jó mutató, ha az adatkészlet kiegyensúlyozatlan. Az ilyen forgatókönyvek pontosságának használata az eredmények félrevezető értelmezését eredményezheti.
tehát most tovább haladunk, hogy megtudjunk egy másik metrikát az osztályozáshoz. Ismét visszatérünk a terhesség osztályozási példájához.
most megtaláljuk a pontosságot (pozitív prediktív érték) az adatpéldányok osztályozásában., A pontosság meghatározása a következő: