DataRobotを触ってみた!特徴についてご紹介

想定される読者

・社内にデータサイエンスを取り入れたい企業担当者の方
・DataRobotなどの自動AIプラットフォームに興味のある方

DataRobotとは

データサイエンスやAIが話題になって久しいですが、データサイエンティストの不足が深刻な問題となっています。その中で、機械学習ついて詳しくない人でも使える機械学習導入ツール(自動AIプラットフォーム)の1つに、DataRobotがあります。DataRobotは“データサイエンスの民主化”を掲げており、多くの企業に注目されています。
今回はそんなDataRobotを触ってみた感想とその特徴について取り上げてみたいと思います。

DataRobot公式HP

自動AIプラットフォームの特徴

本項では、DataRobotに限らない自動AIプラットフォームの特徴について下記に3点挙げます。

①コードが不要

機械学習の実装においては、PythonやRなどのコードを書いてモデルを構築する必要があります。
もちろん、プログラミングを書ける人材がいれば問題ないですが、ビジネスの現場にはコードを書く人材が不足していることが多いです。自動AIプラットフォームでは、ドラッグ&ドロップとクリックのような簡単な操作だけで結果を出すことができます。

②前処理が不要

機械学習をする上で、データの前処理が必要となります。これは、ビジネスの現場で実際に存在するデータが綺麗であることが稀です。また、前処理は地道に操作を行う必要があり、実際のデータサイエンティストもあまりやりたがらないです。しかし、自動AIプラットフォームであれば、前処理も自動的に行ってくれます。

③高度な統計知識が不要

手法の内容をあまり理解していなくてもある程度の予測を行う事ができます。統計学の知識があるに越したことはないですが、自動AIプラットフォームならある程度の知識があれば問題ないです。ただし、デメリットでもあり、基本的な考え方がわかっていないと誤った解釈をしてしまい、企業の意思決定を誤ってしまう可能性があるので、注意しましょう。

DataRobotの特徴

統一感のあるUI

DataRobotは他社製品と異なり、非常にUIが良く結果がわかりやすいです。
ここでは、DataRobotのお試しで利用した結果をいくつか表示致します。

データセット
DataRobotにデータを読み込ませると以下のようになります。
これは、「有用性」という項目でソートされています。
データの特徴が非常にわかりやすくなっています。

特徴量重要度
次の写真は決定木系の機械学習手法で良く登場する特徴量重要度です。
(特徴量重要度とは、予測においてどの変数が寄与しているかを示す指標です。)
通常では、PythonやRなどでモデルを構築し、その後特徴量を出力し、グラフにプロットするという手間がありますが、その手間を圧縮してくれています。
これを一瞥するだけで、どの特徴量が効いているのかわかると思います。

ワードクラウド
続いて、自然言語処理(NLP)の一枚です。
これはワードクラウドという技術で、単語の登場回数などを調べることができます。
非常に理解しやすいことがわかると思います。

サポートの手厚さ

DataRobotでは、サービスを使えるようになるために、講習を随時開いています。
そういった制度も活用する事で、統計学や自動AIプラットフォームに慣れていない企業も容易に導入することができます。
他にも、DataRobot公式HPのblogで分析の具体例などがあるので参考にしやすいです。

最後に

以上で、簡単なDataRobotの紹介を終わりにします。
他にもDataRobot活用に関する記事がネットに複数存在するので、参考にしてみてください。
DataRobotで機械学習をしてみた

DataRobotは効果的ですが、決して安いものではないので、慎重に検討をしましょう!

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です