2019.07.21
元データが少ないとAIは学習できないのか?
ディープラーニングを行なうにはビッグデータが必要ですが、元にする学習データが大量にないと
その機械学習にも様々な手法があり、一般的に想像し易い学習データに正解ラベルを付ける「教師あり学習」に対し、クラスタリングなどの手法利用した「教師なし学習」もあります。但し、これは、あらかじめ出力すべきものを決めておかないというだけで、学習するデータが少なくてよいということには関係ありません。
その「教師無し学習」の中で、GAN(Generative Adversarial Networks:敵対的生成ネットワーク)が、実在しないアイドルの画像を生成したり、フェイク動画を作ったりしたことで、近年非常に注目されてきています。
GANは、競合する2つのニューラルネットワークのシステムによって実装され、相手を騙すためのデータを作るためのモデルと、それが正しいかどうかを判断するためのモデルを使ってトレーニングすることで元のサンプルデータが少なくても、マシン上で似たデータを大量に生成することができます。
また、囲碁の世界で、人間を負かして有名になったGoogle DeepMind のコンピュータ囲碁プログラム「AlphaGo」を破ったのは、ビッグデータ不要で自己対局のみで人工知能同士の対戦という「強化学習」をした「AlphaGo Zero」だったことは、ヒトが学習データをすべて与えなくても
またAIは、クラウドのサービスを中心にすでに学習したことを元に、すべてゼロから学習させなくてもよい環境が、整ってきました。これは、ある程度業種や業務形態を特定して、すでに標準的なデータセットの学習を終えた
企業にとって、満足のいく学習ができているのかどうかは確認が必要ですが、業種や業務内容が同じであればすでに学習済みの
これ以外にも、いかに少ない学習データで
[タグ]
[関連]