一般的に、そして特にPythonのscikit-learnライブラリ(推定された確率はpredict_proba関数によって返される)の両方で、ランダムフォレストによって確率推定がどのように計算されるかを理解することに興味があります。
ありがとう、
男
推奨答え
フォレストによって返される確率は、アンサンブル(
docs)内のツリーによって返される平均確率です。
単一のツリーによって返される確率は、サンプルが着地する葉の正規化されたクラスヒストグラムです。
その他答え #1
Andreas /
Dougalが言ったことに加えて、
RFをトレーニングするとき、
turn on compute_importances=True。
次に、
classifier.feature_importances_
を調べて、RFのツリーの上位で発生している機能を確認します。