English | ็ฎไฝไธญๆ | ๆฅๆฌ่ช | ํ๊ตญ์ด |
Document | Roadmap | Twitter | Discord | Demo
๐ก RAGFlow๋?
RAGFlow๋ ์ฌ์ธต ๋ฌธ์ ์ดํด์ ๊ธฐ๋ฐํ ์คํ์์ค RAG (Retrieval-Augmented Generation) ์์ง์ ๋๋ค. ์ด ์์ง์ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)๊ณผ ๊ฒฐํฉํ์ฌ ์ ํํ ์ง๋ฌธ ์๋ต ๊ธฐ๋ฅ์ ์ ๊ณตํ๋ฉฐ, ๋ค์ํ ๋ณต์กํ ํ์์ ๋ฐ์ดํฐ์์ ์ ๋ขฐํ ์ ์๋ ์ถ์ฒ๋ฅผ ๋ฐํ์ผ๋ก ํ ์ธ์ฉ์ ํตํด ์ด๋ฅผ ๋ท๋ฐ์นจํฉ๋๋ค. RAGFlow๋ ๊ท๋ชจ์ ์๊ด์์ด ๋ชจ๋ ๊ธฐ์ ์ ์ต์ ํ๋ RAG ์ํฌํ๋ก์ฐ๋ฅผ ์ ๊ณตํฉ๋๋ค.
๐ฎ ๋ฐ๋ชจ
๋ฐ๋ชจ๋ฅผ https://demo.ragflow.io์์ ์คํํด ๋ณด์ธ์.
๐ฅ ์ ๋ฐ์ดํธ
2024-08-22 RAG๋ฅผ ํตํด SQL ๋ฌธ์ ํ ์คํธ๋ฅผ ์ง์ํฉ๋๋ค.
2024-08-02: graphrag์ ๋ง์ธ๋๋งต์์ ์๊ฐ์ ๋ฐ์ GraphRAG๋ฅผ ์ง์ํฉ๋๋ค.
2024-07-23: ์ค๋์ค ํ์ผ ๋ถ์์ ์ง์ํฉ๋๋ค.
2024-07-21: ๋ ๋ง์ LLMs(LocalAI, OpenRouter, StepFun, Nvidia)๋ฅผ ์ง์ํฉ๋๋ค.
2024-07-18: ๊ทธ๋ํ์ ๋ ๋ง์ ๊ตฌ์ฑ์์(Wikipedia, PubMed, Baidu, Duckduckgo)๋ฅผ ์ถ๊ฐํฉ๋๋ค.
2024-07-08: Graph๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ์ํฌํ๋ก์ฐ๋ฅผ ์ง์ํฉ๋๋ค.
2024-06-27: Q&A ๋ถ์ ๋ฐฉ๋ฒ์์ Markdown๊ณผ Docx๋ฅผ ์ง์ํฉ๋๋ค.
2024-06-27: Docx ํ์ผ์์ ์ด๋ฏธ์ง ์ถ์ถ์ ์ง์ํฉ๋๋ค.
2024-06-27: Markdown ํ์ผ์์ ํ ์ถ์ถ์ ์ง์ํฉ๋๋ค.
2024-06-06: ๋ํ ์ค์ ์์ ๊ธฐ๋ณธ์ผ๋ก Self-RAG๋ฅผ ์ง์ํฉ๋๋ค.
2024-05-23: ๋ ๋์ ํ ์คํธ ๊ฒ์์ ์ํด RAPTOR๋ฅผ ์ง์ํฉ๋๋ค.
2024-05-15: OpenAI GPT-4o๋ฅผ ํตํฉํฉ๋๋ค.
๐ ์ฃผ์ ๊ธฐ๋ฅ
๐ญ "Quality in, quality out"
- ์ฌ์ธต ๋ฌธ์ ์ดํด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ณต์กํ ํ์์ ๋น์ ํ ๋ฐ์ดํฐ์์ ์ง์์ ์ถ์ถํฉ๋๋ค.
- ๋ฌธ์ ๊ทธ๋๋ก ๋ฌดํํ ํ ํฐ์์ "๋ฐ์ดํฐ ์์ ๋ฐ๋"์ ์ฐพ์๋ ๋๋ค.
๐ฑ ํ ํ๋ฆฟ ๊ธฐ๋ฐ์ chunking
- ๋๋ํ๊ณ ์ค๋ช ๊ฐ๋ฅํ ๋ฐฉ์.
- ๋ค์ํ ํ ํ๋ฆฟ ์ต์ ์ ์ ๊ณตํฉ๋๋ค.
๐ฑ ํ ๋ฃจ์๋ค์ด์ ์ ์ค์ธ ์ ๋ขฐํ ์ ์๋ ์ธ์ฉ
- ํ ์คํธ ์ฒญํน์ ์๊ฐํํ์ฌ ์ฌ์ฉ์๊ฐ ๊ฐ์ ํ ์ ์๋๋ก ํฉ๋๋ค.
- ์ค์ํ ์ฐธ๊ณ ์๋ฃ์ ์ถ์ ๊ฐ๋ฅํ ์ธ์ฉ์ ๋น ๋ฅด๊ฒ ํ์ธํ์ฌ ์ ๋ขฐํ ์ ์๋ ๋ต๋ณ์ ์ง์ํฉ๋๋ค.
๐ ๋ค๋ฅธ ์ข ๋ฅ์ ๋ฐ์ดํฐ ์์ค์์ ํธํ์ฑ
- ์๋, ์ฌ๋ผ์ด๋, ์์ , ํ ์คํธ ํ์ผ, ์ด๋ฏธ์ง, ์ค์บ๋ณธ, ๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ, ์น ํ์ด์ง ๋ฑ์ ์ง์ํฉ๋๋ค.
๐ ์๋ํ๋๊ณ ์์ฌ์ด RAG ์ํฌํ๋ก์ฐ
- ๊ฐ์ธ ๋ฐ ๋๊ท๋ชจ ๋น์ฆ๋์ค์ ๋ง์ถ ํจ์จ์ ์ธ RAG ์ค์ผ์คํธ๋ ์ด์ .
- ๊ตฌ์ฑ ๊ฐ๋ฅํ LLM ๋ฐ ์๋ฒ ๋ฉ ๋ชจ๋ธ.
- ๋ค์ค ๊ฒ์๊ณผ ๊ฒฐํฉ๋ re-ranking.
- ๋น์ฆ๋์ค์ ์ํํ๊ฒ ํตํฉํ ์ ์๋ ์ง๊ด์ ์ธ API.
๐ ์์คํ ์ํคํ ์ฒ
๐ฌ ์์ํ๊ธฐ
๐ ์ฌ์ ์ค๋น ์ฌํญ
- CPU >= 4 cores
- RAM >= 16 GB
- Disk >= 50 GB
- Docker >= 24.0.0 & Docker Compose >= v2.26.1
๋ก์ปฌ ๋จธ์ (Windows, Mac, Linux)์ Docker๊ฐ ์ค์น๋์ง ์์ ๊ฒฝ์ฐ, Docker ์์ง ์ค์น๋ฅผ ์ฐธ์กฐํ์ธ์.
๐ ์๋ฒ ์์ํ๊ธฐ
vm.max_map_count
๊ฐ 262144 ์ด์์ธ์ง ํ์ธํ์ธ์:vm.max_map_count
์ ๊ฐ์ ์๋ ๋ช ๋ น์ด๋ฅผ ํตํด ํ์ธํ์ธ์:$ sysctl vm.max_map_count
๋ง์ฝ
vm.max_map_count
์ด 262144 ๋ณด๋ค ์๋ค๋ฉด ๊ฐ์ ์์ค์ ํ์ธ์.# ์ด ๊ฒฝ์ฐ์ 262144๋ก ์ค์ ํ์ต๋๋ค.: $ sudo sysctl -w vm.max_map_count=262144
์ด ๋ณ๊ฒฝ ์ฌํญ์ ์์คํ ์ฌ๋ถํ ํ์ ์ด๊ธฐํ๋ฉ๋๋ค. ๋ณ๊ฒฝ ์ฌํญ์ ์๊ตฌ์ ์ผ๋ก ์ ์ฉํ๋ ค๋ฉด /etc/sysctl.conf ํ์ผ์ vm.max_map_count ๊ฐ์ ์ถ๊ฐํ๊ฑฐ๋ ์ ๋ฐ์ดํธํ์ธ์:
vm.max_map_count=262144
๋ ํฌ์งํ ๋ฆฌ๋ฅผ ํด๋ก ํ์ธ์:
$ git clone https://github.com/infiniflow/ragflow.git
๋ฏธ๋ฆฌ ๋น๋๋ Docker ์ด๋ฏธ์ง๋ฅผ ์์ฑํ๊ณ ์๋ฒ๋ฅผ ์์ํ์ธ์:
๋ค์ ๋ช ๋ น์ด๋ฅผ ์คํํ๋ฉด dev ๋ฒ์ ์ RAGFlow Docker ์ด๋ฏธ์ง๊ฐ ์๋์ผ๋ก ๋ค์ด๋ก๋๋ฉ๋๋ค. ํน์ Docker ๋ฒ์ ์ ๋ค์ด๋ก๋ํ๊ณ ์คํํ๋ ค๋ฉด, docker/.env ํ์ผ์์
RAGFLOW_VERSION
์ ์ํ๋ ๋ฒ์ ์ผ๋ก ์ ๋ฐ์ดํธํ ํ, ์๋ฅผ ๋ค์ดRAGFLOW_VERSION=v0.10.0
๋ก ์ ๋ฐ์ดํธ ํ ๋ค, ๋ค์ ๋ช ๋ น์ด๋ฅผ ์คํํ์ธ์.$ cd ragflow/docker $ chmod +x ./entrypoint.sh $ docker compose up -d
๊ธฐ๋ณธ ์ด๋ฏธ์ง๋ ์ฝ 9GB ํฌ๊ธฐ์ด๋ฉฐ ๋ก๋ํ๋ ๋ฐ ์๊ฐ์ด ๊ฑธ๋ฆด ์ ์์ต๋๋ค.
์๋ฒ๊ฐ ์์๋ ํ ์๋ฒ ์ํ๋ฅผ ํ์ธํ์ธ์:
$ docker logs -f ragflow-server
๋ค์ ์ถ๋ ฅ ๊ฒฐ๊ณผ๋ก ์์คํ ์ด ์ฑ๊ณต์ ์ผ๋ก ์์๋์์์ ํ์ธํฉ๋๋ค:
____ ______ __ / __ \ ____ _ ____ _ / ____// /____ _ __ / /_/ // __ `// __ `// /_ / // __ \| | /| / / / _, _// /_/ // /_/ // __/ / // /_/ /| |/ |/ / /_/ |_| \__,_/ \__, //_/ /_/ \____/ |__/|__/ /____/ * Running on all addresses (0.0.0.0) * Running on http://127.0.0.1:9380 * Running on http://x.x.x.x:9380 INFO:werkzeug:Press CTRL+C to quit
๋ง์ฝ ํ์ธ ๋จ๊ณ๋ฅผ ๊ฑด๋๋ฐ๊ณ ๋ฐ๋ก RAGFlow์ ๋ก๊ทธ์ธํ๋ฉด, RAGFlow๊ฐ ์์ ํ ์ด๊ธฐํ๋์ง ์์๊ธฐ ๋๋ฌธ์ ๋ธ๋ผ์ฐ์ ์์
network abnormal
์ค๋ฅ๊ฐ ๋ฐ์ํ ์ ์์ต๋๋ค.์น ๋ธ๋ผ์ฐ์ ์ ์๋ฒ์ IP ์ฃผ์๋ฅผ ์ ๋ ฅํ๊ณ RAGFlow์ ๋ก๊ทธ์ธํ์ธ์.
๊ธฐ๋ณธ ์ค์ ์ ์ฌ์ฉํ ๊ฒฝ์ฐ,
http://IP_OF_YOUR_MACHINE
๋ง ์ ๋ ฅํ๋ฉด ๋ฉ๋๋ค (ํฌํธ ๋ฒํธ๋ ์ ์ธ). ๊ธฐ๋ณธ HTTP ์๋น์ค ํฌํธ80
์ ๊ธฐ๋ณธ ๊ตฌ์ฑ์ผ๋ก ์ฌ์ฉํ ๋ ์๋ตํ ์ ์์ต๋๋ค.service_conf.yaml ํ์ผ์์ ์ํ๋ LLM ํฉํ ๋ฆฌ๋ฅผ
user_default_llm
์ ์ ํํ๊ณ ,API_KEY
ํ๋๋ฅผ ํด๋น API ํค๋ก ์ ๋ฐ์ดํธํ์ธ์.์์ธํ ๋ด์ฉ์ llm_api_key_setup๋ฅผ ์ฐธ์กฐํ์ธ์.
์ด์ ์ผ๊ฐ ์์๋ฉ๋๋ค!
๐ง ์ค์
์์คํ ์ค์ ๊ณผ ๊ด๋ จํ์ฌ ๋ค์ ํ์ผ๋ค์ ๊ด๋ฆฌํด์ผ ํฉ๋๋ค:
- .env:
SVR_HTTP_PORT
,MYSQL_PASSWORD
,MINIO_PASSWORD
์ ๊ฐ์ ์์คํ ์ ๊ธฐ๋ณธ ์ค์ ์ ํฌํจํฉ๋๋ค. - service_conf.yaml: ๋ฐฑ์๋ ์๋น์ค๋ฅผ ๊ตฌ์ฑํฉ๋๋ค.
- docker-compose.yml: ์์คํ ์ docker-compose.yml์ ์ฌ์ฉํ์ฌ ์์๋ฉ๋๋ค.
.env ํ์ผ์ ๋ณ๊ฒฝ ์ฌํญ์ด service_conf.yaml ํ์ผ์ ๋ด์ฉ๊ณผ ์ผ์นํ๋๋ก ํด์ผ ํฉ๋๋ค.
./docker/README ํ์ผ์๋ ํ๊ฒฝ ์ค์ ๊ณผ ์๋น์ค ๊ตฌ์ฑ์ ๋ํ ์์ธํ ์ค๋ช ์ด ์์ผ๋ฉฐ, ./docker/README ํ์ผ์ ๋์ด๋ ๋ชจ๋ ํ๊ฒฝ ์ค์ ์ด service_conf.yaml ํ์ผ์ ํด๋น ๊ตฌ์ฑ๊ณผ ์ผ์นํ๋๋ก ํด์ผ ํฉ๋๋ค.
๊ธฐ๋ณธ HTTP ์๋น์ค ํฌํธ(80)๋ฅผ ์
๋ฐ์ดํธํ๋ ค๋ฉด docker-compose.yml ํ์ผ์์ 80:80
์ <YOUR_SERVING_PORT>:80
์ผ๋ก ๋ณ๊ฒฝํ์ธ์.
๋ชจ๋ ์์คํ ๊ตฌ์ฑ ์ ๋ฐ์ดํธ๋ ์ ์ฉ๋๊ธฐ ์ํด ์์คํ ์ฌ๋ถํ ์ด ํ์ํฉ๋๋ค.
$ docker-compose up -d
๐ ๏ธ ์์ค์์ ๋น๋ํ๊ธฐ
Docker ์ด๋ฏธ์ง๋ฅผ ์์ค์์ ๋น๋ํ๋ ค๋ฉด:
$ git clone https://github.com/infiniflow/ragflow.git
$ cd ragflow/
$ docker build -t infiniflow/ragflow:dev .
$ cd ragflow/docker
$ chmod +x ./entrypoint.sh
$ docker compose up -d
๐ ๏ธ ์์ค์์ ์๋น์ค ์์ํ๊ธฐ
์๋น์ค๋ฅผ ์์ค์์ ์์ํ๋ ค๋ฉด:
๋ ํฌ์งํ ๋ฆฌ๋ฅผ ํด๋ก ํ์ธ์:
$ git clone https://github.com/infiniflow/ragflow.git $ cd ragflow/
๊ฐ์ ํ๊ฒฝ์ ์์ฑํ๊ณ , Anaconda ๋๋ Miniconda๊ฐ ์ค์น๋์ด ์๋์ง ํ์ธํ์ธ์:
$ conda create -n ragflow python=3.11.0 $ conda activate ragflow $ pip install -r requirements.txt
# CUDA ๋ฒ์ ์ด 12.0๋ณด๋ค ๋์ ๊ฒฝ์ฐ, ๋ค์ ๋ช ๋ น์ด๋ฅผ ์ถ๊ฐ๋ก ์คํํ์ธ์: $ pip uninstall -y onnxruntime-gpu $ pip install onnxruntime-gpu --extra-index-url https://aiinfra.pkgs.visualstudio.com/PublicPackages/_packaging/onnxruntime-cuda-12/pypi/simple/
์ง์ ์คํฌ๋ฆฝํธ๋ฅผ ๋ณต์ฌํ๊ณ ํ๊ฒฝ ๋ณ์๋ฅผ ์ค์ ํ์ธ์:
# ํ์ด์ฌ ๊ฒฝ๋ก๋ฅผ ๋ฐ์์ต๋๋ค: $ which python # RAGFlow ํ๋ก์ ํธ ๊ฒฝ๋ก๋ฅผ ๋ฐ์์ต๋๋ค: $ pwd
$ cp docker/entrypoint.sh . $ vi entrypoint.sh
# ์ค์ ์ํฉ์ ๋ง๊ฒ ์ค์ ์กฐ์ ํ๊ธฐ (๋ค์ ๋ ๊ฐ์ export ๋ช ๋ น์ด๋ ์๋ก ์ถ๊ฐ๋์์ต๋๋ค): # - `which python`์ ๊ฒฐ๊ณผ๋ฅผ `PY`์ ํ ๋นํฉ๋๋ค. # - `pwd`์ ๊ฒฐ๊ณผ๋ฅผ `PYTHONPATH`์ ํ ๋นํฉ๋๋ค. # - `LD_LIBRARY_PATH`๊ฐ ์ค์ ๋์ด ์๋ ๊ฒฝ์ฐ ์ฃผ์ ์ฒ๋ฆฌํฉ๋๋ค. # - ์ ํ ์ฌํญ: Hugging Face ๋ฏธ๋ฌ ์ถ๊ฐ. PY=${PY} export PYTHONPATH=${PYTHONPATH} export HF_ENDPOINT=https://hf-mirror.com
๋ค๋ฅธ ์๋น์ค(MinIO, Elasticsearch, Redis, MySQL)๋ฅผ ์์ํ์ธ์:
$ cd docker $ docker compose -f docker-compose-base.yml up -d
์ค์ ํ์ผ์ ํ์ธํ์ฌ ๋ค์ ์ฌํญ์ ํ์ธํ์ธ์:
- docker/.env์ ์ค์ ์ด conf/service_conf.yaml์ ์ค์ ๊ณผ ์ผ์นํ๋์ง ํ์ธํฉ๋๋ค.
- service_conf.yaml์ ๊ด๋ จ ์๋น์ค์ ๋ํ IP ์ฃผ์์ ํฌํธ๊ฐ ๋ก์ปฌ ๋จธ์ ์ IP ์ฃผ์์ ์ปจํ ์ด๋์์ ๋ ธ์ถ๋ ํฌํธ์ ์ผ์นํ๋์ง ํ์ธํฉ๋๋ค.
RAGFlow ๋ฐฑ์๋ ์๋น์ค๋ฅผ ์์ํฉ๋๋ค:
$ chmod +x ./entrypoint.sh $ bash ./entrypoint.sh
ํ๋ก ํธ์๋ ์๋น์ค๋ฅผ ์์ํฉ๋๋ค:
$ cd web $ npm install --registry=https://registry.npmmirror.com --force $ vim .umirc.ts # proxy.target์ http://127.0.0.1:9380๋ก ์ ๋ฐ์ดํธํฉ๋๋ค. $ npm run dev
ํ๋ก ํธ์๋ ์๋น์ค๋ฅผ ๋ฐฐํฌํฉ๋๋ค:
$ cd web $ npm install --registry=https://registry.npmmirror.com --force $ umi build $ mkdir -p /ragflow/web $ cp -r dist /ragflow/web $ apt install nginx -y $ cp ../docker/nginx/proxy.conf /etc/nginx $ cp ../docker/nginx/nginx.conf /etc/nginx $ cp ../docker/nginx/ragflow.conf /etc/nginx/conf.d $ systemctl start nginx
๐ ๋ฌธ์
๐ ๋ก๋๋งต
RAGFlow ๋ก๋๋งต 2024์ ํ์ธํ์ธ์.
๐ ์ปค๋ฎค๋ํฐ
๐ ์ปจํธ๋ฆฌ๋ทฐ์
RAGFlow๋ ์คํ์์ค ํ์ ์ ํตํด ๋ฐ์ ํฉ๋๋ค. ์ด๋ฌํ ์ ์ ์ ๋ฐํ์ผ๋ก, ์ฐ๋ฆฌ๋ ์ปค๋ฎค๋ํฐ์ ๋ค์ํ ๊ธฐ์ฌ๋ฅผ ํ์ํฉ๋๋ค. ์ฐธ์ฌํ๊ณ ์ถ์ผ์๋ค๋ฉด, ๋จผ์ ๊ฐ์ด๋๋ผ์ธ์ ๊ฒํ ํด ์ฃผ์ธ์.