wikimedia/wikipedia
Viewer • Updated • 61.6M • 266k • 1.23k
How to use tugaa/PaJpRAG_system with sentence-transformers:
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("tugaa/PaJpRAG_system")
sentences = [
"The weather is lovely today.",
"It's so sunny outside!",
"He drove to the stadium."
]
embeddings = model.encode(sentences)
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]このプロジェクトは、Retrieval Augmented Generation (RAG) システムのデモンストレーションです。
このプロジェクトは、Retrieval Augmented Generation (RAG) システムのデモンストレーションです。大規模言語モデル (LLM) の「幻覚」問題や情報鮮度の課題を解決するため、外部の知識ベースから関連情報を検索し、それを基に回答を生成します。
rinna/japanese-gpt-neox-3.6b-instruction-sft モデルを推論に使用しています。app.py: Gradio UI の定義と、RAGSystem および LLM パイプラインの統合を管理するメインアプリケーションファイルです。ragsys03.py: RAGシステムのコアロジック(文書のエンベディング、FAISSインデックスの構築と検索、文書管理、永続化)をカプセル化したモジュールです。rag_data/: RAGシステムが生成するFAISSインデックスファイル、ロードされた文書データ、およびメタデータが保存されるディレクトリです。.
├── app.py
├── ragsys03.py
├── requirements.txt
└── rag_data/ (RAGシステムが生成するインデックスや文書の保存先)
└── (日付_UUID)/
├── faiss_index.bin
├── documents.json
└── metadata.json
以下のライブラリが必要です。requirements.txt ファイルに記載されています。
torch
transformers
sentence-transformers
faiss-cpu
gradio
numpy
sentencepiece
accelerate
インストールするには、以下のコマンドを実行します。
pip install -r requirements.txt
注: GPU環境で高速化したい場合は、faiss-cpu の代わりに faiss-gpu をインストールしてください。
GitHubリポジトリをクローンするか、Hugging Face Space のファイルをダウンロードします。
app.py と ragsys03.py を同じディレクトリに配置します。
上記の「必要なライブラリ」をインストールします。
ターミナルで以下のコマンドを実行し、アプリケーションを起動します。
python app.py
表示されたURL(通常は http://127.0.0.1:7860 または Hugging Face Spaces のURL)をブラウザで開きます。
documents というキーに文字列のリストを持つJSONファイルを選択してアップロードします。
例:
{
"documents": [
"RAG(Retrieval Augmented Generation)は、大規模言語モデルの課題、特に幻覚や情報鮮度の問題を解決するために考案された強力なAIフレームワークです。",
"LLMの幻覚(Hallucination)は、大規模言語モデルが事実と異なる情報を生成してしまう問題です。"
]
}
アップロードが完了すると、ステータスが表示されます。
rinna/japanese-gpt-neox-3.6b-instruction-sft モデルは比較的大規模であるため、応答に時間がかかる場合があります。このプロジェクトはデモンストレーションを目的としていますが、改善提案やバグ報告は歓迎します。 ```