metrikák választani?

Gyakran, amikor beszélek szervezetek keres, hogy a gép adatai a tudomány a folyamatok, gyakran felmerül a kérdés, “Hogyan tudom a legpontosabb modell?”. Megkérdeztem: “milyen üzleti kihívást próbálsz megoldani a modell használatával?,”meg fogom kapni a rejtélyes megjelenést, mert az általam feltett kérdés nem igazán válaszol a kérdésükre. Ezután meg kell magyaráznom, hogy miért tettem fel a kérdést, mielőtt elkezdenénk megvizsgálni, hogy a pontosság a ” legjobb “modellt választjuk-e.

tehát azt gondoltam, hogy ebben a blogbejegyzésben elmagyarázom, hogy a pontosságnak nem kell az egyetlen modellmutató – adat, amelyet a tudósok üldöznek, és más metrikák egyszerű magyarázatát is tartalmazzák.

először nézzük meg a következő zavart mátrixot. Mi a pontosság a modell számára?,

div >

nagyon könnyen észreveheti, hogy a modell pontossága nagyon magas, 99,9%!! Hűha! Megütötted a főnyereményt és a Szent Grált (*sikíts és szaladj körbe a szobában, többször is pumpáld az öklöd a levegőbe*)!

de….(Nos, tudod, hogy ez jól jön?) mi lenne, ha megemlíteném, hogy a pozitív itt valójában valaki, aki beteg és olyan vírust hordoz, amely nagyon gyorsan terjedhet?, Vagy a pozitív itt csalási ügyet jelent? Vagy a pozitív itt a terrorista, hogy a modell azt mondja, hogy nem terrorista? Nos, érted az ötletet. A költségek, amelyek egy rosszul Osztályozott tényleges pozitív (vagy hamis negatív) nagyon magas itt ebben a három körülmények között, hogy én jelentette.

OK, tehát most rájöttél, hogy a pontosság nem a legjobb modell kiválasztásakor használható be-all and end-all modell metrika … most mi?

hadd mutassak be két új mutatót (ha még nem hallottál róla, és ha igen, talán csak viccelj egy kicsit, és folytasd az olvasást?, :D)

tehát ha megnézzük a Wikipédiát, látni fogjuk, hogy a precizitás és a visszahívás kiszámításának képlete a következő:

div >

hadd tegyem ide a zavart mátrixot és annak részeit.