2022年5月11日(水)より3日間開催される、エッジAI、ディープラーニング、人工知能、画像認識などの最新のAI技術が集結する日本最大級の展示会イベント『第六回 AI・人工知能 EXPO』が東京ビッグサイトで開催されました。

記者は、鮮やかなオレンジ色のブースと「AI文字起こし」・「まるごと議事録」の文字に惹かれ、Rimo合同会社が提供するAI文字起こし/議事録サービス『Rimo voice』に注目した。

ブース内には、『Rimo voice』を実際に使って文字起こしが出来るよう、ノートパソコンとマイクが複数台設置されています。

『Rimo voice』について

・『Rimo voice』はクラウドベースの日本語に特化したAI文字起こし/議事録サービスで、音声・動画データまたはブラウザ上で録音した音声を文字起こし出来るサービスです。
・日本語に特化した自然言語処理技術を使っているため、句読点を含めた自然な日本語を読み込むことができます。
・1時間の音声データが5分程度という速さで文字起こしデータを作成することが可能で、文字起こしデータと音声データをクラウドサービス上に保存することが可能です。
・音声データと文字起こしデータは連動しており、文字を選択することでピンポイントに該当部分の音声を聞くことが可能になっています。
・文字起こしデータはURLで簡単にシェアすることができ、会議の議事録の代わりとしても使うことができ、文字起こしデータはユーザー自身で修正することができます。
・対応している動画と音声の拡張子はM4A,MP3,WAV,MP4,MOV,AACと幅広く、様々な媒体からのデータを文字起こしすることが出来ます。
・30秒20円の従量課金となる個人プランの他、法人向けの定額プランがあります。

Rimo Voice:https://rimo.app/about/voice

Rimo合同会社 宮野 功晟氏 インタビュー

『Rimo voice』に注目した記者は、Rimo合同会社 宮野 功晟氏にサービスの内容や機能について詳しく伺うことが出来ました。

●Rimo合同会社の提供するサービス内容を教えてください。

動画や音声をクラウド上にアップすることで、1時間の音声でも5分程度で文字起こしが出来るクラウドサービスを提供しています。

●文字起こしサービス『Rimo voice』を開発したきっかけをお聞かせください。

弊社は、企業理念に“はたらくを未来に”を掲げており、副業やリモートで働いている人を主体に構成している組織です。正社員が4名、副業として就業されている業務委託の方が約40名、そして固定のオフィスが無いこともあり、新しい働き方に挑戦しています。

『Rimo voice』というサービスは、元々新しい働き方をサポートするツールとして内部向けに開発した所から始まっています。
コロナ禍によってリモートワークが一般的になりましたが、コミュニケーション面での問題点が多く発生しています。しかし、会議に出席出来なかった人がいても、全て文字起こしとして記録しておくことで、会議中の重要な会話のみを聞き直くよう指示したり、指示される側も会議の中で必要な部分だけを聴くことが出来るようになりました。

現在のようにツールを外部に提供するようになったのは、約2年前からのことになります。

●音声入力の精度はどれくらいでしょうか

『Rimo voice』は日本語に特化しており、不要な「えー、あー」といったフィラーと呼ばれる単語はAIが自動的に可能な限り取り除くようにしています。精度としては、90%以上を達成しています。2年前に提供が始まった頃から、現在も徐々に精度が向上しています。

業界ごとに特化したデータベースも開発しており、専門用語があるような業界のお客様でも『Rimo voice』を活用いただけるような仕組みになっています。

●リアルタイムでの文字起こしは可能ですか?

『Rimo voice』には、データをアップロードして文字起こしする方法の他にも、リアルタイム文字起こしにも対応しています。精度が高いのは、データをアップロードする方法になるので、文字起こしをする際にはこの方法を弊社では推奨しています。

お客様からも、実際の用途としてリアルタイム文字起こしはあまり活用されていないようです。会議中にリアルタイム文字起こしを行ってみると、多くの方が最初のうちは「おー、凄いね」という反応をしますが、実際の会議ではリアルタイムで文字起こしが出来る様子を観察していると、本来の目的である会議や議論に集中出来ないとのご意見を頂きました。

以上のことから、会議が終わってから音声データをアップロードしていただく方法を推奨させていただいております。

●他社の同様のサービスと比較した、『Rimo voice』の強みは

大きく分けて3つの強みがございます。まず速さとして1時間の音声でも5分程度文字起こしが可能となる所です。2点目として、動画でも文字起こしが出来るという点です。『Rimo voice』の場合、動画の音声の文字起こしが可能だという所と、動画にも字幕が表示されることに加え、文字起こしされた部分をクリックすることで、対応する再生時間に移動することが出来る点です。3点目として、シンプルで使いやすい設計になっていることで、コストメリットの観点から他社さんのサービスで導入に至らなかったお客様でも、弊社の『Rimo voice』は使いやすくて良かったとお声をいただくことがあるくらいです。

●導入実績を教えてください。

導入は数百社を超えており、直近の導入実績は東京都(自治体)様、パーソルホールディングス株式会社様、株式会社翔泳社様などの大手企業様にも活用いただくことが増えました。テレビ番組「アッコにおまかせ!」で取り上げていただいたこともあり、『Rimo voice』への流入や問い合わせが増えてきております。

●今後の展望などお聞かせください。

弊社は、会議の「DX(デジタルトランスフォーメーション)」を中心にやっていきたいと考えております。“はたらくを未来に”という観点で働く上で避けて通れない会議を効率化することは大きな意味があると考えています。

「会議のDX」は、デジタイゼーション、デジタライゼーション、デジタルトランスフォーメーションという3つのフェーズに分けて考えています。
1つ目のデジタイゼーションは、これまでアナログだったものをデジタルデータにするというフェーズで、直近1-2年進めてきたものになります。次のデジタイゼーション、デジタルトランスフォーメーションというフェーズになってくると、文字起こしから、AIが「ToDo・議題・決定事項・要約」を自動的に抽出してくれる所を想定しています。さらに3年後の長期スパンでは、それらが出来るようになった上で人事評価への活用も考えております。

会議は、働く人のそのものの姿を現しています。ToDoや次のアクションに繋がる発言が多い若手は高く評価するといったような働き方の分析が可能になると、従来考慮しきれなかった観点からも評価することが出来るようになり、公正な評価にも繋がると考えています。

動画で見る『Rimo voice』

同社の協力の元、『Rimo voice』の解説や、ブラウザ上で動作する様子を撮影させていただくことが出来ました。

機能解説

2022年5月11日 11時08分に公開されたプレスリリースで、多くのユーザーから要望があった自動話者設定機能が追加されたことが公開されています。文字起こしされたデータに手動で話者ごとに改行と話者名の設定をすることで、AIに音声と話者名を学習させ、90%の精度で自動的に話者を設定することが出来るようになっています。(再生時間1:01~)

動画による文字起こし

動画ファイルをアップロードして文字起こしをすることで、ブラウザ上の画面左側に「字幕入り」の動画、右側には文字起こしされたテキストが表示されます。
テキストをクリックすることで、そのテキストを発話している再生時間に移動することが出来るので、会議の中の重要な部分や聞きたい話題の箇所だけを聞くことが出来ます。

Rimo合同会社 会社概要

私たちは「はたらくを未来に」を理念に、フルリモートワークや副業での働き方、ティール組織などのあたらしいパラダイムを積極的に取り入れている会社が、成長しやすい仕組みをつくっていきます。Deep Learningによる日本語音声認識など先端技術に積極的に投資し、リモートワークの弊害になり得る会議などのコミュニケーションに関わる領域でサービスを展開しています。
• 設立日: 2019年10月1日
• 資本金: 300万円
• 代表社員: 相川 直視
• 所在地: 東京都渋谷区恵比寿3-46-7-204
• URL: https://rimo.app/about/voice