コンテンツにスキップ

主要機能

プロジェクト単位で文書と分析結果を管理します。

  • プロジェクトの作成/編集/削除
  • 言語設定(韓国語、英語、日本語)
  • 文書分析プロンプトのカスタマイズ
  • プロジェクトごとのカラーテーマ

さまざまな形式のファイルをアップロードすると、自動的にファイルタイプを検出し、適切な前処理パイプラインにルーティングします。文書(PDF、DOC、TXT)、画像(PNG、JPG、GIF、TIFF)、映像(MP4、MOV、AVI)、音声(MP3、WAV、FLAC)ファイルを最大500MBまでサポートします。

  • ドラッグ&ドロップ / 複数ファイルアップロード
  • 自動ファイルタイプ検出とパイプラインルーティング
  • PaddleOCR(SageMaker)テキスト抽出
  • Bedrock Data Automation 文書構造分析(オプション)
  • PDFテキストレイヤー抽出(pypdf)
  • 音声/映像トランスクリプション(AWS Transcribe)

ファイルタイプ別前処理フローの詳細はPreprocessing Pipelineを参照してください。

ファイルタイプ対応フォーマット前処理
文書PDF, DOC, TXTPaddleOCR + BDA(オプション)+ PDFテキスト抽出
画像PNG, JPG, GIF, TIFFPaddleOCR + BDA(オプション)
映像MP4, MOV, AVIAWS Transcribe + BDA(オプション)
音声MP3, WAV, FLACAWS Transcribe

アップロードされた文書はStep Functionsワークフローを通じて自動的に分析されます。Strands SDKベースのReAct Agentがセグメントごとに反復的質問-応答方式の深層分析を実行します。

  • セグメントごとの深層分析(Claude Sonnet 4.6 Vision ReAct Agent)
  • 映像分析(TwelveLabs Pegasus 1.2)
  • 文書要約生成(Claude Haiku 4.5)
  • ベクトル埋め込みと保存(Nova Embed 1024d → LanceDB)
  • 再分析 / Q&A再生成 / Q&Aの追加・削除
文書アップロード
→ 前処理(OCR、BDA、Transcribe)
→ セグメント分割
→ Distributed Map(最大30同時実行)
→ ReAct Agent分析(セグメントごと)
→ ベクトル埋め込み → LanceDB保存
→ 文書要約生成

詳細な分析フローはAI Analysis Pipelineを参照してください。


ワークフローの進行状況をWebSocketを通じてリアルタイムでフロントエンドに配信します。DynamoDB Streamsが状態変更を検出し、Redisでアクティブな接続を検索してWebSocket APIでイベントをプッシュします。

  • ステップごとの開始/完了/エラー通知
  • セグメント分析進行率(X/Y完了)
  • ワークフロー開始/完了/エラー通知
  • アーティファクトおよびセッション作成イベント

分析が完了した文書のセグメントごとの結果を詳細に確認できます。

  • セグメントごとのOCR / BDA / PDFテキスト / AI分析結果の確認
  • 映像セグメントのタイムコードベース表示
  • トランスクリプションセグメントの確認
  • Q&A再生成(カスタム指示適用)
  • Q&Aの追加・削除
  • 文書全体の再分析

Bedrock Agent Coreベースの対話型AIインターフェースです。IDP AgentとResearch AgentがMCP Gatewayを通じて文書検索、アーティファクト生成などのツールを活用し、プロジェクトにアップロードされた文書をもとに質疑応答を行います。

  • ストリーミング応答およびツール使用過程のリアルタイム表示
  • 画像/文書添付(マルチモーダル入力)
  • マークダウンレンダリングおよびコードハイライト
  • セッション管理(作成/名前変更/削除、会話履歴保存)

チャット中にAI Agentが自動的にプロジェクト文書を検索します。

  • ベクトル検索 + 全文検索(FTS)
  • 韓国語形態素解析(Kiwi)
  • Cohere Rerank v3.5 結果リランキング

プロジェクトごとにカスタムエージェントを作成して特化した分析を実行できます。

  • エージェント名とシステムプロンプトの設定
  • エージェントの作成/編集/削除
  • 会話中のエージェント切り替え
ツール説明
search_documentsプロジェクト文書のハイブリッド検索
save/load/edit_markdownマークダウンファイルの作成・編集
create_pdf, extract_pdf_text/tablesPDF生成およびテキスト/テーブル抽出
create_docx, extract_docx_text/tablesWord文書生成およびテキスト/テーブル抽出
generate_imageAI画像生成
code_interpreterPythonコード実行

AIチャット中にエージェントが生成したファイル(PDF、DOCX、画像、マークダウンなど)をアーティファクトギャラリーで管理します。

  • アーティファクトの一覧表示と検索
  • インラインプレビュー(画像、PDF、マークダウン、HTML、DOCX)
  • ダウンロードと削除
  • プロジェクトごとのフィルタリング
  • 元のプロジェクトへの移動