iPhone修理・iPad修理のダイワンテレコム大阪梅田駅店です。
iPhoneとGoogle Pixelを並べ、同時に音声による文字入力を行うテストを行ったところ、PixelのほうがiPhoneよりも有意に音声からテキストを起こすスピードが速いことが明らかになりました。
開発者のJames Cham氏が自身のTwitter上にアップロードした動画が話題の元となっています。
James Cham氏が自身のTwitterにアップロードした動画では、iPhone(iOS)とPixel(Android)を並べて音声入力モードにしてスピーチを行い、同時に文字起こしさせるというテストを行っています。
やや早めの喋り方にも関わらず、Pixelによる文字起こしスピードはほぼリアルタイムで、スムーズに音声が文章に変換されていきます。
同氏のスピーチが終わると同時にPixelでは文字起こしを完了しています。
一方のiPhoneは、スピーチの最中にも文字起こしに引っかかりや大きな遅れが見られています。
iPhoneは同氏のスピーチが終わってから約7秒後に文字起こしを完了しています。
James Cham氏はこのテストの結果について、「Pixelはとても反応が良いので、私の心を読み取っているように感じる。」と述べています。
また、同氏はPixelとiPhoneの音声による文字入力速度について、実用する上では大きな問題にはならないとしつつも、音声認識エンジンは「コマンドラインのようなもの」と述べ、音声からテキストへの変換が高速になるほど使用するリソースが減り、「真にインタラクティブ」な音声体験の可能性があると語りました。
アップル関連のブログ「DARING FIREBALL」を管理するJohn Gruber氏は、James Cham氏によるテストの結果について「Appleのアクセシビリティ機能は素晴らしく、他の誰よりも優れているが、音声からテキストへの文字起こしは悲惨なほど遅れを取っている。」と評価しつつ、一方でAppleが音声による文字変換の効率を改善させれば「あらゆる種類のスタートレックレベルでの操作が可能になる」と語っています。
※スタートレックとは、アメリカのSFドラマ。登場する宇宙船・宇宙ステーションは音声入力であらゆる宇宙言語を翻訳したり、空間ワープなどが行える。
James Cham氏の投稿にコメントをつけているTwitterユーザーは、iPhoneにおいてもある方法を用いることでPixelに近い音声入力速度を実現できるとして、動画を投稿しています。
動画では、iOSにGoogleの文字入力アプリ「Gboard」をインストールし、それを利用することで文字起こし速度を改善できることを示唆していました。
iPhoneでも音声認識エンジンを変更することでPixelに近い文字起こし速度を実現できるということは、PixelとiPhoneの文字起こし速度の差はハードウェア上の差異ではなく「ソフトウェアの差異」、つまりAppleの『Siri』とGoogleの音声認識エンジンの性能差と推測することができます。
Appleは先日、機械学習に関する技術を持つカナダの企業Inductivを買収したと報じられており、Apple自身も『Siri』の性能を向上させる必要があると認識しているのではないかと思われます。
source:9to5Mac
source:Twitter / @JamesCham
梅田店
530-0001
大阪府大阪市北区梅田1丁目3−1地下1階 大阪駅前第1ビル
06-6131-9797