「AI TV®」「AIメタデータ®」商標取得
我社のAI開発
今、世界中の開発者が「AIの開発」に必死で挑んでいる。AIの開発と言っても、その範囲はとてつもなく広い。我々もご多分に漏れず、そのAIの開発に携わっている。
そこで、我々のAI開発チームが挑戦している「動画認識」技術開発についての奮闘記を具体的に綴ってみようと思う。動画認識技術は主に「音声認識」や「文字認識」、それに「形の認識」等の要素技術がある。
まず「音声認識」技術では、音素の認識から始まり、音素の集合つまり言葉単位の認識を施して文字に落としてゆくというプロセスがある。ここで大変面白いことに気がついた。
言葉が集まった文章単位の認識は過去の文章を学習させ、そのエキスを基に新たに認識した音の連続を文章に落としてゆくと言ったプロセスが必要となる。
しからば、どんな文章(記事)を予め学習させておくと良いのだろうか。ここが知恵の絞りどころである。
認識をする対象が「スポーツ」であるのか、「事件」であるのかといった、所謂ジャンル選定が一つのポイントとなる。「スポーツ」であるならばスポーツの記事を大量にAIに読み込ませて、学習させておけば精度はより高くなる。
しかも認証をする対象が新たなスポーツであるならば、例えば「ピョンチャン五輪」で新たに採用された種目であれば、その辺りの記事を大量に学習させておく必要がある。こうした手段は人間が学習するのと同様である。
過去の知識をベースに新たな記事を認識し、新たな知識として格納してゆくという手法である。新たな知識を格納したら、その知識も次の認識の肥やしになるというわけだ。
ということは、認識技術とは積み重ねた知識とその知識がどの時期に生まれたものであるかを意識し、上手に学習させる必要があるということになる。そう考えると人間が知識を使う構造がいかに素晴らしいものであるか改めて感じるようになる。
こうした具体的検証と工夫を積み重ね、AIは少しずつ成長してくれる。
JCC特許の概要