Owli-AI Assist
シーンを解析し、質問し、音声で答えを受け取れる画像説明アシスタントです。
AI を活用した視覚アシスタンス。
このページは機械翻訳で、現在編集レビュー前です。
概要
- 役立つこと
- シーンを解析し、質問し、音声で答えを受け取れる画像説明アシスタントです。
- 使い方
- アプリを開き、必要な機能を選び、画面表示または音声案内を利用します。
- 注意点
- 支援機能は役立ちますが、重要な場面や安全に関わる場面での自己確認に代わるものではありません。
クラウドモードの注目点
- スナップショットを撮影して VLM リクエストとして送信。
- 文脈を保ったまま追加質問を続けられます。
- Auto-Scan で定期的にシーンを更新。
- 音声入力でハンズフリー操作に対応。
- Streaming TTS により素早く音声でフィードバック。
主な機能
-
AI によるシーン説明(クラウドモード)
撮影した画像を Vision-Language モデルに送信し、分かりやすい言葉で説明します。
-
追加質問
現在の場面について、文字、物体、細部などを具体的に質問できます。
-
自動スキャン
必要に応じて一定間隔で新しい画像を解析し、周囲の変化を継続的に知らせます。
-
音声入力とストリーミング音声出力
質問は音声入力で行え、回答はリアルタイムの音声で再生されます。
-
追加撮影で文脈を補強
より詳しい分析のために追加画像を撮影できます。
-
個別アシスタンスプロフィール
短く簡潔、詳細重視、安全重視など、応答スタイルを調整できます。
-
文脈に応じた支援(自動モード)
買い物、駅、道路、レストランなどの状況を推定し、関連情報を優先します。
プライバシー
動作モード: クラウド
Assist は通常 Owli のバックエンド経由で AI リクエストを処理し、任意の BYOK モードでは画像、テキスト、必要に応じて追加画像を OpenRouter に直接送信します。
要点
- AI 機能では画像や質問データを Owli バックエンドまたはモデル提供者へ送信します。
- ライブプレビューは可能な範囲で端末上で動作します。
- 詳細はプライバシーポリシーに記載しています。
ライブプレビューは主に端末上で動作します。バックエンドでの追加質問では質問文と元のシーン画像が再送され、問題のある AI 回答の報告は現在 30 日間保存されます。
Android に直接インストール
Google Play から直接インストールするか、PC で閲覧している場合は QR コードを読み取ってください。
スマートフォンですぐ開く
スマートフォンで QR コードを読み取り、ストアページを開いてください。
システム要件
- Android 10 以降
- カメラとマイク
- クラウドモード用の安定したインターネット接続
詳細と使い方
Owli-AI Assist は誰のためのアプリですか
Owli-AI Assist は、AI を使って周囲をより良く理解したい失明者や重度視覚障害者を対象としています。人的支援の代わりではありませんが、多くの日常場面で追加情報を提供できます。
画像説明アプリとして、Assist は場面を分かりやすく説明し、追加質問に答える視覚アシスタンスを提供します。音声操作に対応しているため、ハンズフリーで素早く情報を得られます。
アプリが行うこと
Owli-AI Assist は、次の流れで視覚支援を行います。
- カメラが現在の場面を捉えます。
- 画像が AI モデルに送信されます。
- モデルが場面を分かりやすく説明します。
- 必要に応じて具体的な追加質問ができます。
例えば次のような質問が可能です。
- 目の前には何がありますか。
- この標識の文字を読んでください。
- 棚にはどんな商品がありますか。
- ディスプレイには何と表示されていますか。
回答は音声で再生されるため、手を空けたまま利用できます。
継続的な情報のための自動スキャン
自動スキャンモードでは、一定間隔で新しい画像を解析します。手動で毎回操作しなくても、周囲の変化を継続的に把握できます。
音声入力と音声出力
質問は音声で行えます。回答はストリーミング音声で返されるため、長い説明でも最後まで待たずに聞き始められます。
パーソナライズされた文脈対応アシスタンス
Owli-AI Assist では、複数のアシスタンスプロフィールを使えます。短く簡潔な説明、より詳細な説明、安全重視など、目的に応じた調整が可能です。
自動モードでは、日常場面を推定して重要情報を優先します。
例:
- 道路環境 では車両、動き、信号機を優先します。
- スーパーマーケット では商品、棚、価格情報を重視します。
- 駅や停留所 では入口、表示、位置の手がかりを優先します。
- レストランやカフェ では人、テーブル、メニューを重視します。
On-Device 検出(任意)
将来的な拡張として、選択した物体をスマートフォン上で直接認識するローカル検出モードを想定しています。このモードではインターネット接続なしで動作し、画像データは端末内だけで処理されます。
プライバシーと処理
ライブプレビューは主に端末上で動作します。外部にデータが送信されるのは、Neue Szene や追加質問など、あなたが明示的に AI 機能を実行したときだけです。
標準設定では、Assist はそれらのリクエストを Owli バックエンド経由で処理します。バックエンドでの追加質問では、質問文と元のシーン画像が再送され、画像文脈を保ったまま回答が生成されます。
任意の BYOK モード では、アプリは AI リクエストを OpenRouter に直接送信します。機能によっては、シーン画像、質問文、追加画像が含まれる場合があります。
Report AI answer を使うと、スクリーンショットや画像ファイルを含まない報告データが Owli バックエンドへ送られ、現在はレビューのために 30 日間保存されます。
完全版は Owli-AI Assist のプライバシーポリシー で確認できます。
メディア
-
新しいシーン解析を始める開始画面 -
交通場面を構造化して説明する画面 -
道や分岐の向きを案内する画面 -
画像文脈つきの追加質問に答える画面 -
小さな対象や細部を分かりやすく説明する画面
次のステップ
ストア公開、テスト参加、質問、提携の相談まで、整理された形で対応します。