AI文字起こしツール「Otter」とは?使い方や機能、料金、それぞれのプランのメリット・デメリットまで紹介

Otterは、AIを活用した音声認識技術を用いて、英語の会話や講義、ミーティングなどを自動で文字起こしするツールです。

本記事では世界中で多く利用されている音声認識AIサービス「Otter」を紹介します。

このサービスを利用することで、英語での会議や講義の内容をリアルタイムにテキスト化し、議事録作成の手間を大幅に削減できます。さらに特定のプラン以上であれば話者を自動的に識別し、誰が何を話したかといったメタデータも記録されます。

また、リアルタイムだけでなく、会議を記録した音声ファイルや動画ファイルから高速でテキスト変換も可能です。
たとえば、1時間ほどの動画でさえ5分程度でテキスト化し、要点を抜き出してさまざまなファイル(mp3、txt、pdf、docx)に変換したり、同ライセンスに登録されたユーザー間での共有も可能です。

今回は、Otterとは何かというところから、料金プラン、機能、登録方法、活用事例なども合わせて紹介します。

アバター画像
監修者 nyann_writer

現役のシステムエンジニアとして10年程度のキャリアがあります。 Webシステム開発を中心に、バックエンドからフロントエンドまで幅広く対応してきました。 最近はAIやノーコードツールも触っています。

\エキスパートが回答!/
この記事に関する質問はこちら
記事に関するご質問以外にも、システム開発の依頼やAIの導入相談なども受け付けております。

    会社名必須
    必須
    必須
    Eメール必須
    電話番号必須
    ご依頼内容必須

    Otterとは?


    Otterとは、アメリカの企業Otter.aiが開発した英語の音声認識AIサービスです。AI技術を使った音声認識を利用し、英語の会議やセミナーなどの音声を自動で文字起こしできます。

    会議やセミナーにはもちろん、インタビューなどのダイアログや、英会話のレッスンや自身の発音確認など音声データがあればOtterはすべてに有効活用できます。
    シリコンバレー企業の国際会議通訳や、NASAのプロジェクトでも一部利用されている高性能なツールです。
    ※ちなみにOtterとは「カワウソ」を意味します。

    Otterは英語を1秒未満でリアルタイムに書き起こしてくれます。
    音声認識の精度も高く、ノイズカットや話者の識別まで行ったうえでスプレッドシードやWordに対応した文章にエクスポートされるため、データをまとめる時間を大幅に短縮します。

    以前であれば書き起こし作業は、速記者に英文書き起こしを依頼するか自ら通訳しながら文字起こしをする必要がありました。
    Otterを導入することで、書き起こしの手間を省き、翻訳と仕上げに集中できます。

    特に、英語圏の動画の字幕制作TEDなどの配信サービス翻訳においては、ダイレクトな恩恵を受けられるでしょう。
    議事録用にと正確な文章起こしをするときでも、逐一すべての文脈を気にせず、言い直しや間違いといった個別の文脈を修正するだけで済み、大幅な時間短縮が可能です。

    英語学習者のスピーチ指導といった活用例であれば、Otterの書き起こしを活用することで発音ミスをユーザーにもわかりやすく指摘でき、修正点を発見しやすくなります。

    ※2024年10月現在、Otterは日本語に対応していません。あくまで英文のみの対応となっています。

    Otterの登録方法

    ここではOtterの登録方法について説明します。

    Otterには無料版があります。

    モバイルアプリ、ブラウザどちらからも登録が可能です。
    認証方法はGoogle アカウントMicrosoftアカウントメールアドレス登録の3種類です。

    では実際の画面を参考にしながら手順を解説していきましょう。

    Step1: Otterの公式サイトにアクセス

    まずはOtter公式サイトにアクセスしてください。
    右上の「Start for Free」ボタンから新規登録ができます。

    Otter公式サイトはこちら

    Step2: 無料で始めるをクリック


    二つのプランを選択できます。

    左側が通常のBasic(フリープラン)、右側がBusinessプランの7日間トライアルバージョンです。

    7日間の試用後は月額課金が開始されるため、料金の支払い方法やクレジットカードの登録画面といった手順が追加されます。

    本記事ではBasicプランで登録を進めます。

    「Get Started」をクリックすると、アカウントの作成画面に移ります。

    Step3: GoogleアカウントかMicrosoftsアカウント、もしくはメールアドレスを入力

    Google、Microsoftのアカウントでサインインするか、メールアドレスを入力してアカウントを作成します。

    OtterはGoogleカレンダースプレッドシートとの連携性が高いため、Googleアカウントで認証した場合、多くの機能の同期がスムーズに利用できます。
    特にパソコン端末やタブレット機器を使い分けないのであれば、Googleアカウントでの登録が無難でしょう。
    アカウント登録後、公式サイトにアクセスするだけで自動的にログイン状態となります。

    本記事もGoogleアカウントでの登録を前提に進めます。

    Step4: 会議録画オプションを選択

    会議録画機能OtterPilotを利用するかどうかを選択します。

    OtterPilotは、会議への参加、音声の録音、メモの作成、スライドのキャプチャ、要約の生成、チームの質問への回答といった作業を自動的に行う AIアシスタントです。

    たとえば、スケジュールが合わずにユーザー自身がオンライン会議に参加できなかったとしても、OtterPilotがユーザーとして自動的に参加してくれるため、本人不在のままであっても議事録の記録やサマリーの作成が可能です。

    席に戻ったユーザーは出来上がったサマリーをもとに会議を振り返ることができ、それらをメンバー間で共有するかどうかも選択できます。

    デフォルトではZoom、Google Meet、Microsoft Teamsのみ対応となっていますが、専用のクライアントアプリをインストールすることでSlackのミーティングでも活用できます。

    以上でOtterへの登録は完了です。

    Otterの使い方

    システム開発の外注がおすすめのケース5選

    Otterは直感的なインターフェースを持つAI音声認識ツールですが、その機能を最大限に活用するためには、基本的な使い方を理解することが重要です。

    ここではOtterの以下の主要機能について使い方を紹介します。

    • Record
    • Import
    • Paste meeting URL to record

    以下ではそれぞれの機能について詳しく説明します。

    Record

    「Record」機能は、Otterの最も基本的な機能の一つです。この機能を使用することで、リアルタイムで音声を録音し、同時に文字起こしを行えます。

    こちらがOtterのホーム画面です。

    ホーム画面では、録音やウェブコンテンツの文字起こし、カレンダーに同期されたスケジュールに従ったOtterPilotのアサインといった設定が可能です。

    右上の「Record」を実行することでリアルタイムの録音と書き起こしが始まります。録音中は、話されている内容が自動的にテキスト化され、後から簡単に確認できます。

    Import

    「Import」機能を使用すると、既存の音声ファイルやビデオファイルをOtterにアップロードして文字起こしが可能です。

    Import」機能もホーム画面から利用可能です。ホーム画面右上の「Import」をクリックすると、対象ファイルのアップロードを求められます。

    mp3、mp4といった音声、動画ファイルに対応しており、エクスポートの形式を選択したのち直ちにテキストとサマリーが作成されます

    Paste meeting URL to record

    Otterでは、会議のURLを貼り付けることで、自動的にその会議に参加し、記録を開始する機能もあります。

    この機能を使用すると、Zoom、Google Meet、Microsoft Teamsなどのオンライン会議プラットフォームの会議URLを貼り付けて、直接会議の文字起こしができます。

    「Paste meeting URL to record」機能もホーム画面から利用します。会議のURLをコピーし、Otterのホームページ上部にある「Paste meeting URL to record」フィールドに貼り付けて実行します。

    これにより、OtterPilotが自動的にZoomやGoogle Meetなどのオンライン会議に参加し、会議内容を記録します。

    Otterの機能

    Otterは英語での会話や会議をリアルタイムで高精度に書き起こしてくれます。
    議事録の裏付けが簡単にでき、会議の内容をより正確に理解できるようになりました。

    Otterには以下のような機能があります。

    • リアルタイム文字起こし
    • 自動で概要作成
    • Otterアシスタント機能
    • エクスポート機能
    • 発言者識別機能
    • 単語・人名登録機能

    順番に詳しく解説していきます。

    リアルタイム文字起こし

    Otterの主要機能は、リアルタイムでの文字起こしです。AIを活用した高精度の音声認識技術により、話者の発言を素早く正確にテキスト化します。

    この機能を使うことで、会議や講義、インタビューなどの音声をリアルタイムでテキストに変換できます。英語はもちろん、多言語に対応しているため、グローバルなコミュニケーションにも活用できます。

    ただし、日本語には対応していない点に注意が必要です。

    リアルタイム文字起こし機能は、会議の議事録作成や講義のノート作成にかかる時間と手間を大幅に節約できます。

    自動で概要作成

    Otterには、文字起こしした内容から自動的に要約を生成する機能があります。AIが重要なポイントを抽出し、簡潔な概要を作成します。

    例えば、1時間の会議を30秒の要約に凝縮することができるため、参加者は重要なポイントを迅速に把握できます。

    自動生成された要約は、後で内容を振り返る際や、他の人と情報を共有する際に役立ちます。

    Otterアシスタント機能

    Otterには「OtterPilot」というアシスタント機能があり、ZoomやGoogle Meet、Microsoft Teamsなどのオンライン会議に自動的に参加し、会議の議事録を作成してくれます。

    この機能により、ユーザーは会議中にメモを取る必要がなくなり、より会話に集中できるようになります。

    「OtterPilot」を利用すると、会議終了後に会議の要点やアクションプランをまとめた議事録を作成してくれたり、会議の自動要約やスライドを作成してくれたりします。

    例えば、長時間の会議の文字起こしデータから特定のトピックに関する情報を探したい場合、OtterPilotに質問することで、関連する部分を即座に見つけ出すことができます。

    エクスポート機能

    Otterでは、文字起こしした内容を様々な形式でエクスポートできます。

    テキストファイル、PDF、Word文書などの形式で保存可能で、他のアプリケーションとの連携も容易です。ファイル共有だけではなく、同僚や他のユーザーとリンクで簡単に共有する機能もあります。

    また、仮想会議用のスライドキャプチャを自動で作成できるため、手作業でサムネイルを作ったりパワーポイントなどの資料を作る手間も省けます。

    Otter内でフォルダー管理もでき、フォルダーにはそれぞれ管理者権限やアクセス制限を設けることも可能なので、プロダクトに応じたメンバー・ユーザーの選別も可能です。

    さらに、Proプラン以上であれば、Otterの一般チャンネルを利用可能となり、SlackChatWorkといったコミュニケーションツールを経由することなく、直接チームメンバー全員に共有できるといったメリットもあります。

    発言者識別機能

    Otterは、複数の話者がいる会話でも、それぞれの発言を識別し、誰が何を言ったかを正確に記録します。この機能は、会議や座談会、インタビューなどの文字起こしで特に役立ちます。

    例えばスプレットシートに出力する場合、Proプラン以上であれば、同一の入力機器(1つのマイクなど)であっても話者ごとに異なる色分けがされ、話した内容が一覧で把握しやすくなっています。

    講演会場や、観衆のいる場でのインタビュー会場、空けたオフィスといった雑音が入りやすい環境でもしっかりと聞き分けることができ、再現性の高いデータが出力されます。

    単語・人名登録機能

    Otterでは、専門用語や固有名詞を事前に登録しておくことで、文字起こしの精度を向上できます。この機能は、特定の分野や組織で頻繁に使用される用語があるときに便利です。

    例えば、医療分野の会議では専門的な病名や薬品名が頻出しますが、これらを事前に登録しておくことで、AIがより正確に認識できるようになります。同様に、社内で使用される特殊な略語や製品名なども登録可能です。

    単語・人名登録機能を活用することで、Otterの文字起こし精度がさらに向上し、より正確で信頼性の高い文字起こしデータを得られます。

    Otterの料金プランと無料版の制限

    Otterには無料版の基本プランと、有料の上位プランを含め4種類あります。

    • Basic
    • Pro
    • Business
    • Enterprise

    プランごとの主な機能は以下の通りです。

    プラン 料金 文字起こし時間/月 ウェブデータのインポート数 ライセンス数 同時に対応可能な会議数 その他の主な機能
    Basic 無料 300分 3回のみ 1 1 (フリープラン)
    Pro $9.99/月 1,200分 1ユーザーあたり毎月10 5 2 高品質オーディオストリーミング
    Business $20/月 6,000分 無制限 25 3 DropboxやZoomとの自動同期
    Enterprise 要問合せ カスタマイズ可能 無制限 カスタマイズ可能 3 大規模向けのカスタマイズに応じた料金設定

    基本的な機能はフリープランであるBasicにも搭載されています。お試しで利用する場合はBasicプランで十分でしょう。

    ただしライセンス数が1つのみのため、チームやプロジェクトで利用する場合は必然的に有料プランとなります。ウェブデータのインポート機能が特に強力なため、頻繁に利用される場合はBusinessプラン以上の利用をおすすめします。

    では、それぞれのプランについて詳しく見ていきましょう。

    Basic

    Basic 無料
    メリット 無料で利用可能
    最大300分/月の文字起こし
    リアルタイム文字起こしと基本的な機能が使える
    デメリット 文字起こし時間に制限あり
    発言者識別や詳細な検索機能がない
    データのエクスポート形式に制限あり
    ウェブデータのインポートは3つのみ
    30分以上の録音データを保存できない
    特徴 ウェブおよびモバイルでの録音対応
    各種デバイスの音声入力に対応
    同期ハイライト再生や自動サマリーが利用可能

    Basicプランは、Otterの無料版プランです。ライセンス普及は一つのため、個人でのみ利用できます。

    Basicプランは月300分までの会議録音を文字起こしできる機能を提供しています。会議での発言内容をリアルタイムでテキストデータとして記録できます。

    音声データを文字起こしする機能は、セミナーや講義のレポートを作成するなど、ビジネスシーンにかかわらず活用できます。個人での利用も検討してみるのもおすすです。

    なお、エクスポートのファイル形式は制限があり、mp3、テキストべースのみとなっています。

    個人のアカウントであればパソコン端末やタブレット・スマートフォンのアプリ版「Otter」からログインし、様々なデバイスから会議の音声を文字に起こすことが可能です。

    Otterを活用することで会議の準備や記録、整理の手間を削減し、大幅な業務効率化が期待できます。

    まずは使ってみたいという人はBasicプランで試してみるのがおすすめです。

    Pro

    Pro $9.99/月
    メリット: 月1,200分の文字起こし可能
    発言者の自動識別とネームドタグ機能あり
    データの出力形式が追加
    デメリット: 有償で月額$9.99の費用が発生
    ウェブデータのインポートは月/10個までと控えめ
    特徴: 最大90分の長時間録音に対応。
    複数のデータエクスポート形式に対応。
    0.5倍~3倍の可変再生スピードと無音スキップ対応

    月額$9.99のProプランでは、月1,200分の会議録音を文字起こしできるようになります。

    さらに、Basicプランにはない発言者の自動識別機能(スピーカー分離)が追加されています。会議中の発言者を判別し、誰が何を話したかをテキストで色分けして示してくれます。

    発言者の自動識別機能では、デフォルト状態であれば、speaker1,2,3 のように識別されますが、タグ付けすることで話者の名前を自動で挿入することも可能です

    また、文字起こしデータのエクスポート形式が増え、pdf、docx(Word)、CSV、TSVといった出力にも対応しています。

    会議の内容を他のツールと連携して活用や、最大90分のデータ保存ができるほか、音声の再生速度もカスタマイズできます。高品質のオーディオストリーミングも利用でき、音声認識の精度が向上します。

    以下では、Proプランに変更する手順についても説明します。

    画面の左下にある「Get Otter Pro」をクリックすることで、プランのアップグレード画面に移ります。

    クレジットカード情報を入力し、プランを変更できます。また、課金形態は月額制と年間制で選べます。長期的な利用を継続される場合は年間プランの利用もおすすめです。

    Business

    Business $20/月
    メリット: 最大20個の会議ルームが作成可能
    月/6,000分の保存容量。
    DropboxやZoomとの自動連係
    ウェブデータのインポートが無制限
    デメリット: 月額$20と比較的高額
    特徴: チームとユーザーごとのカスタム辞書登録が可能
    最大4時間の長時間文字起こしに対応
    3つの同時ミーティングが可能
    より強力な管理者機能が利用可能

    月額$20のBusinessプランでは、管理者権限とカスタム辞書で企業利用に適した機能が充実しており、最大20個の会議ルームを作成できるようになります。

    会議ルームごとにメンバーを割り当て、社内の複数プロジェクトで利用しやすくなります。

    また、録音時間も最大4時間と大きく容量が増加しています。DropboxZoomといった外部サービスにも同期が行えるようになり、クラウド録音サービスの制限も撤廃されるため、実質録音ファイルの保存数は無制限となります。

    カスタム辞書機能により、業界での固有の専門用語を登録して認識精度を向上できます。より専門性の高いプロジェクトごとに頻出する単語の設定が可能なため、カスタマイズ性が向上しています。

    管理者権限も強化されており、アクティビティや統計情報といったメタデータを扱えるようになります。あまり利用のないユーザーを削除したり、権限の再割り当てなどをしたりと、より一元的な管理がしやすくなります。

    大規模プロジェクトや社内で共通ツールとして活用する場合はBusiness以上のプランがおすすめです。

    Enterprise

    Enterprise カスタマイズに応じて変動
    メリット: ユーザー数など大規模な要件に対応可能
    販売支援のOtterPilot for Salesが利用可能
    ニーズに合わせた高度なカスタマイズが可能
    特徴: 800名+800単語のカスタム登録が可能
    大規模プロジェクトに特化した機能セット
    最大4時間の長時間文字起こしと同時3ミーティング対応

    Enterpriseプランは、大規模プロジェクト向けの高度なカスタマイズが特徴であるOtter最上位のプランです。価格は一定ではなく、カスタマイズに応じた見積もりが必要です。

    Enterpriseプランでは、会議ルーム数やユーザー数、文字起こし時間などをニーズに合わせて調整できます。高度なセキュリティ要件にも対応しており、包括的なサポートを提供しています。

    また、Otter.ioが提供しているOtterPilot for Salesを利用可能となります。主な機能は、自動メモ作成、AI営業インサイト、Salesforce自動同期、チャット、一元管理された顧客電話メモなどがあります。

    本記事では紹介のみにとどめますが、内容を詳しく知りたい方はリンク先をご参照ください。

    OtterPilot for Salesについてはこちら

    関連記事
    OpenAIの音声認識AI「Whisper」とは?使い方や文字起こしの精度を解説
    OpenAIの音声認識AI「Whisper」とは?使い方や文字起こしの精度を解説

    Otterを利用する際のデメリットや注意点

    システム開発の内製がおすすめのケース5選

    Otterを利用する際には、いくつかのデメリットや注意点があります。

    Otterの主なデメリットは以下のとおりです。

    • 日本語には対応していない
    • プライバシーとセキュリティに配慮する
    • 音声品質と内容が正確か確認する
    • 利用するユーザのトレーニングを行う

    以下にそれぞれのポイントを詳しく説明します。

    日本語には対応していない

    Otterの最大のデメリットの一つは、日本語に対応していないことです。

    Otterは現在、英語のみに特化した文字起こしツールであり、日本語を含む他の言語での直接的な文字起こしはできません。このため、日本語での会議や講義の文字起こしはできません。

    また、ツールのUIやマニュアルも英語のみなため、英語が得意でないユーザーにとっては、操作やサポートが難しい場合があります。

    プライバシーとセキュリティに配慮する

    Otterはクラウドベースのサービスであるため、録音したデータはインターネット上に保存されます。

    このため、プライバシーやセキュリティには注意が必要です。特に、機密性の高い情報を含む音声を録音する場合は、プライバシーとセキュリティに関するポリシーをよく確認し、適切な対策を講じる必要があります。

    必要に応じて、録音データの削除やアクセス制限などの設定を行いましょう。

    音声品質と内容が正確か確認する

    AIによる文字起こしは高精度ですが、完璧ではありません。

    特に雑音が多い環境では、正確な文字起こしが難しくなるため、録音環境を整えることが重要です。また、話者のアクセントや話し方、専門用語の使用頻度などによっても精度は変動します。

    文字起こし結果を確認し、必要に応じて修正しましょう。

    利用するユーザのトレーニングを行う

    Otterを組織内で導入する場合、ユーザーに対して適切なトレーニングを行うことが重要です。

    トレーニングでは、Otterの基本的な使用方法だけではなく、発言者識別機能や単語・人名登録機能などを活用することで、文字起こしの精度を向上できます。

    また、文字起こし結果の編集方法やエクスポート方法なども理解しておくことで、Otterをよりスムーズに利用できるようになります。

    まとめ:Otterで簡単に英語の音声を文字起こしができる

    この記事では、Otterの主な特徴や機能、料金プラン、登録方法を紹介しました。

    英語の会話をリアルタイムでテキスト化し、話者を識別して記録してくれるOtterは、議事録作成、動画の字幕作成、インタビュー、翻訳作業など、幅広い業務の手間を大幅に削減できます。

    ただし、日本語の文字起こし対応はしていない点に注意が必要です。

    Otterは、海外の映画インタビュアーや、英会話教室やレッスン、動画作成の翻訳作業、VR(バーチャルライブ)上でのリアルタイム変換<、といったビジネスシーンで活躍しており、今後も需要は増えていくと予想されます。

    今後海外でのビジネスモデルを考慮する場合、Otter利用を検討してみてはいかがでしょうか。

    JiteraではAIを活用したシステム開発を含め、AIを利用したツールのサポートも行っています。

    AIを活用したアプリ・システム開発、そのほかにもご相談やご質問がありましたら、Jiteraまでお気軽にお問い合わせください。

    AIの最新動向を踏まえた最適なソリューションを提案いたします。

    株式会社Jiteraへのお問い合わせはこちら

    例:開発手順、ツール、プロンプト

    メルマガ登録

    社内で話題になった「生成AIに関するニュース」をどこよりも早くお届けします。