Notion にアップロードした画像からテキスト抽出を簡単に行う小技
こんにちは、CX 事業本部製造ビジネステクノロジー部の若槻です。
今回は、Notion にアップロードした画像からテキスト抽出(OCR)をする方法を紹介します。
方法
テキストが写っている画像データが Notion ページにアップロードされています。この画像からテキスト抽出をしたいとします。
上記 Notion ページを iPhone などの端末上で iOS アプリで開きます。
iOS アプリでページを開いた様子です。
画像をタップして全画面で開き、右下のアイコンをクリックします。
すると、画像内のテキストが認識されます。
テキストを全選択してコピーします。
適当なページにペーストします。謎にハートマークが入っていますが、おおよそ正しくテキスト抽出が行えています。
classmethod TOP >会社情報>経営理念 トップ AWS総合支援♥サービス♥取扱製品♥特長事例♥セミナー♥会社情報♥採用♥|資料請求♥0120-991-668 お問い合わせ 経営理念 お客様のビジネス支援にあたって心がけている基本方針です。 オープンな発想と高い技術力により、すべての人々の創造活動に貢献し続ける クラスメソッドのビジネス クラスメソッドは「オープンな発想と高い技術力により、すべての人々の創造活動に貢献し続ける。」という経営理念のもと、クラウド、モバイル、ビッグデータ、音声認識技術のコンサルティングやシステム開発、運用サービスを提供しています。高い評価を得る技術者集団として、お客様の事業課題に寄り添った提案力と、蓄積・形式化したノウハウをベースに継続的なビジネス支援を行っております。 オープンな発想 広い視野を持ち、何事にも積極的に取り組んでいくのがクラスメソッドのスタイルです。作り手視点のプロ意識と消費者視点のセールス意識を軸に、社員の1人ひとりが現場提案とスピード決裁をモットーとした課題解決を行っています。柔軟かつ行動的な姿勢で、現在は3000社を超える企業への支援実績があります。
文字認識は iOS の機能である
さて、上記の方法は iOS 15 以降で利用可能になった「テキスト認識表示」という機能を利用しています。
なので、下記のように iPhone のカメラロールにある写真などに対しても同様にテキスト抽出が可能です。
東洋経済 (莱和新春号 2024年1集 鑫四季報 全上場 3935$ DOEで株主還元調査! 業績を独自2期予想 全社揭載 增減配回数、四半期進捗率 【四季報ONLINE 今ならおトク詳しくは巻末で 日本企業が飛躍する 2024年へ ISSN 0385-9908
追記:Mac の Safari でも簡単にできた
後で社内で教えてもらったのですが、Mac の Safari でも同様のことができました。
Notion ページを Safari で開くと、画像内のテキストをブラウザ検索できています。
オリジナルの画像を Safari の別タブで開くと、抽出したテキストをコピーすることもできます。
Mac での「テキスト認識表示」機能は macOS Monterey からサポートされているようですね。寡聞にして知りませんでした。
基本的にはテキスト抽出は Mac の機能を利用して、Mac 上で Notion を開けない方は iPhone アプリを使うようにすれば良さそうです。
おわりに
iOS の「テキスト認識表示」を利用して、Notion にアップロードした画像からテキスト抽出を簡単に行う小技でした。
iOS アプリ上で当該ページを開くという条件および手間はいりますが、手動文字起こしをする若干の労力は削減できると思います。
以上