ja sen täytäntöönpanon Python

Afroz Chakure

Seuraa

Jul 6, 2019 · 3 min lue

tässä blogissa me ’ll yrittää kaivaa syvemmälle Random Forest Taksonomia. Täällä opimme ensemble oppimista ja yrittää toteuttaa sen Python.,

löydät koodin täältä.

se on ensemble tree-pohjainen oppimisalgoritmi. Satunnainen Metsä Luokittelija on joukko päätös puita satunnaisesti valittu osajoukko koulutusta asetettu. Se kokoaa eri päätöspuiden äänet päättämään koe-esineen lopullisen luokan.

Ensemble Algorithm:

Ensemble algorithms ovat niitä, jotka yhdistävät useamman kuin yhden saman tai erilaisen algoritmin esineiden luokitteluun. Esimerkiksi käynnissä ennustus yli Naiivi Bayes, SVM ja Päätös Puu, ja sitten kun äänestää lopullinen vastike luokan testi esine.,

Structure of Random Forest Classification

Types of Random Forest models:

1. Random Forest Prediction for a classification problem:

f(x) = majority vote of all predicted classes over B trees

2.,n :

Nine Different Decision Tree Classifiers

Aggregated result for the 9 Decision Tree Classifiers

The 9 decision tree classifiers shown above can be aggregated into a random forest ensemble which combines their input (on the right)., Edellä mainittujen päätöspuun lähtöjen vaaka-ja pystysuuntaisia akseleita voidaan pitää ominaisuuksina x1 ja x2. Kunkin ominaisuuden tietyillä arvoilla päätöspuu antaa luokituksen ”sininen”, ”vihreä”, ”punainen” jne.

Nämä edellä mainitut tulokset on laskettu yhteen, kautta malli ääntä tai keskimäärin, yhdeksi
kokonaisuus, malli, joka päätyy ylittäen yksittäisen päätöksen puu on lähtö.

Ominaisuudet ja Edut Random Forest :

  1. Se on yksi tarkin oppimisen algoritmeja saatavilla. Monille tietokokonaisuuksille se tuottaa erittäin tarkan luokittelijan.,
  2. se toimii tehokkaasti suurissa tietokannoissa.
  3. se pystyy käsittelemään tuhansia tulomuuttujia ilman muuttuvaa poistoa.
  4. se antaa arvioita siitä, mitkä muuttujat ovat luokituksessa tärkeitä.
  5. se tuottaa sisäisen puolueettoman arvion yleistysvirheestä metsärakennuksen edetessä.
  6. sillä on tehokas menetelmä puuttuvien tietojen arvioimiseksi ja se säilyttää tarkkuuden, kun suuri osa tiedoista puuttuu.,

Haitat Random Forest :

  1. Satunnainen metsät on havaittu overfit joillekin datajoukkojen meluisa luokitus/regressio tehtäviä.
  2. tietojen mukaan kategorisen muuttujan eri määrä tasoja, satunnainen metsät ovat puolueellinen hyväksi näitä ominaisuuksia enemmän tasoja. Siksi satunnaismetsän muuttuva tärkeyspisteet eivät ole luotettavia tämän tyyppisille tiedoille.,div>

    Creating a Random Forest Classification model and fitting it to the training data

    Predicting the test set results and making the Confusion matrix

    Conclusion :

    In this blog we have learned about the Random forest classifier and its implementation., Tarkastelimme yhdistettyä oppimisalgoritmia toiminnassa ja yritimme ymmärtää, mikä tekee satunnaisesta metsästä erilaisen muodon muille koneoppimisen algoritmeille.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *