0 Abstract

๐Ÿ“Œ ๊ธฐ์กด RAG ์‹œ์Šคํ…œ์˜ ํ•œ๊ณ„:

  • ํ‰๋ฉด์  ๋ฐ์ดํ„ฐ ํ‘œํ˜„ ์‚ฌ์šฉ, ๋งฅ๋ฝ ์ธ์‹ ๋ถ€์กฑ, ๋ณต์žกํ•œ ์ƒํ˜ธ์˜์กด์„ฑ ํฌ์ฐฉ ์‹คํŒจ, ๋‹จํŽธ์ ์ธ ๋‹ต๋ณ€ ์ƒ์„ฑ

๐Ÿ“Œ ์ œ์•ˆํ•˜๋Š” ํ•ด๊ฒฐ์ฑ…: LightRAG

  • ์ฃผ์š” ํŠน์ง•:
    • ๊ทธ๋ž˜ํ”„ ๊ตฌ์กฐ๋ฅผ ํ…์ŠคํŠธ ์ƒ‰์ธ๊ณผ ๊ฒ€์ƒ‰ ํ”„๋กœ์„ธ์Šค์— ํ†ตํ•ฉ
    • Dual-level ๊ฒ€์ƒ‰ ์‹œ์Šคํ…œ ๋„์ž…
      • Low-level
      • High-level
  • ํ•ต์‹ฌ ๊ธฐ์ˆ :
    • ๊ทธ๋ž˜ํ”„ ๊ตฌ์กฐ์™€ ๋ฒกํ„ฐ ํ‘œํ˜„ ํ†ตํ•ฉ
    • ํšจ์œจ์ ์ธ ์—”ํ‹ฐํ‹ฐ ๋ฐ ๊ด€๊ณ„ ๊ฒ€์ƒ‰
    • ์ฆ๋ถ„ ์—…๋ฐ์ดํŠธ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ตฌํ˜„

1 Instruction

๊ธฐ์กด RAG์‹œ์Šคํ…œ์˜ ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค

  • ์ฒซ์งธ, ๋งŽ์€ ๋ฐฉ๋ฒ•๋“ค์ด ์—”ํ‹ฐํ‹ฐ ๊ฐ„์˜ ๋ณต์žกํ•œ ๊ด€๊ณ„๋ฅผ ์ดํ•ดํ•˜๊ณ  ๊ฒ€์ƒ‰ํ•˜๋Š” ๋Šฅ๋ ฅ์„ ์ œํ•œํ•˜๋Š” ํ‰๋ฉด์ ์ธ ๋ฐ์ดํ„ฐ ํ‘œํ˜„์— ์˜์กด
  • ๋‘˜์งธ, ์ด๋Ÿฌํ•œ ์‹œ์Šคํ…œ๋“ค์€ ์ข…์ข… ๋‹ค์–‘ํ•œ ์—”ํ‹ฐํ‹ฐ์™€ ๊ทธ๋“ค์˜ ์ƒํ˜ธ ๊ด€๊ณ„์— ๊ฑธ์นœ ๋งฅ๋ฝ ์ธ์‹์ด ๋ถ€์กฑํ•˜๊ธฐ ๋•Œ๋ฌธ์—, ์‚ฌ์šฉ์ž ์ฟผ๋ฆฌ์— ๋‹ต๋ณ€์„ ๋ชปํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ์žˆ์Œ. ์‚ฌ์šฉ์ž๋Š” ์ด๋Ÿฌํ•œ ์ฃผ์ œ๋“ค ๊ฐ„์˜ ๋ณต์žกํ•œ ์ƒํ˜ธ ์˜์กด์„ฑ์„ ์ ์ ˆํžˆ ํฌ์ฐฉํ•˜์ง€ ๋ชปํ•˜๋Š” ๋‹จํŽธ์ ์ธ ๋‹ต๋ณ€์„ ๋ฐ›์„ ์ˆ˜ ์žˆ๋‹ค.
  • ๋”๋ณด๊ธฐ
    ์˜ˆ๋ฅผ ๋“ค์–ด์‚ฌ์šฉ์ž๊ฐ€ "์ „๊ธฐ ์ž๋™์ฐจ์˜ ์ฆ๊ฐ€๊ฐ€ ๋„์‹œ ๋Œ€๊ธฐ์งˆ๊ณผ ๋Œ€์ค‘๊ตํ†ต ์ธํ”„๋ผ์— ์–ด๋–ค ์˜ํ–ฅ์„ ๋ฏธ์น˜๋‚˜์š”?"๋ผ๊ณ  ๋ฌผ์œผ๋ฉด,
    ๊ธฐ์กด RAG ๋ฐฉ๋ฒ•๋“ค์€ ์ „๊ธฐ ์ž๋™์ฐจ, ๋Œ€๊ธฐ ์˜ค์—ผ, ๋Œ€์ค‘๊ตํ†ต ๋ฌธ์ œ์— ๋Œ€ํ•œ ๋ณ„๋„์˜ ๋ฌธ์„œ๋“ค์„ ๊ฒ€์ƒ‰ํ•  ์ˆ˜ ์žˆ์ง€๋งŒ,
    ์ผ๊ด€๋œ ์‘๋‹ต์œผ๋กœ ์ข…ํ•ฉํ•˜๋Š” ๋ฐ ์–ด๋ ค์›€์„ ๊ฒช์„ ์ˆ˜ ์žˆ๋‹ค
    ์ „๊ธฐ ์ž๋™์ฐจ ์ฑ„ํƒ์ด ๋Œ€๊ธฐ์งˆ์„ ์–ด๋–ป๊ฒŒ ๊ฐœ์„ ํ•  ์ˆ˜ ์žˆ๋Š”์ง€, ์ด๊ฒƒ์ด ๋‹ค์‹œ ๋Œ€์ค‘๊ตํ†ต ๊ณ„ํš์— ์–ด๋–ค ์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ๋Š”์ง€๋ฅผ ์„ค๋ช…ํ•˜์ง€ ๋ชปํ• ์ˆ˜ ์žˆ๋‹ค

๐Ÿ“Œ  ์ œ์•ˆํ•˜๋Š” ํ•ด๊ฒฐ๋ฐฉ์•ˆ : ๊ทธ๋ž˜ํ”„ ๊ตฌ์กฐ ํ†ตํ•ฉ

  • ์—”ํ‹ฐํ‹ฐ ๊ฐ„ ์ƒํ˜ธ์˜์กด์„ฑ ํšจ๊ณผ์  ํ‘œํ˜„
  • ๊ด€๊ณ„์— ๋Œ€ํ•œ ๋ฏธ๋ฌ˜ํ•œ ์ดํ•ด ๊ฐ€๋Šฅ
  • ๋‹ค์ค‘ ์†Œ์Šค ์ •๋ณด์˜ ์ผ๊ด€๋œ ํ†ตํ•ฉ
  • ๋งฅ๋ฝ์ด ํ’๋ถ€ํ•œ ์‘๋‹ต ์ƒ์„ฑ

LightRAG์˜ ์ฃผ์š” ํŠน์ง•

  • ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ํ…์ŠคํŠธ ์ƒ‰์ธ ํŒจ๋Ÿฌ๋‹ค์ž„
  • Dual-level ๊ฒ€์ƒ‰ ํ”„๋ ˆ์ž„์›Œํฌ
    • Low-level: ํŠน์ • ์—”ํ‹ฐํ‹ฐ์™€ ๊ด€๊ณ„์— ๋Œ€ํ•œ ์ •ํ™•ํ•œ ์ •๋ณด
    • High-level: ๋” ๋„“์€ ์ฃผ์ œ์™€ ํ…Œ๋งˆ ํฌ๊ด„
  • ๊ทธ๋ž˜ํ”„ ๊ตฌ์กฐ์™€ ๋ฒกํ„ฐ ํ‘œํ˜„ ํ†ตํ•ฉ

๐Ÿ“Œ  ํ•ด๊ฒฐํ•ด์•ผ ํ•  ์ฃผ์š” ๊ณผ์ œ

  1. ํฌ๊ด„์ ์ธ ์ •๋ณด ๊ฒ€์ƒ‰
    • ์ƒํ˜ธ ์˜์กด์  ์—”ํ‹ฐํ‹ฐ์˜ ์ „์ฒด ๋งฅ๋ฝ ํฌ์ฐฉ
    • ๋ชจ๋“  ๋ฌธ์„œ์—์„œ์˜ ํšจ๊ณผ์ ์ธ ์ •๋ณด ์ถ”์ถœ
  2. ํ–ฅ์ƒ๋œ ๊ฒ€์ƒ‰ ํšจ์œจ์„ฑ
    • ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์ง€์‹ ๊ตฌ์กฐ ๊ฒ€์ƒ‰ ๊ฐœ์„ 
    • (์‘๋‹ต ์‹œ๊ฐ„ ๋‹จ์ถ•)
  3. ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ ์ ์‘
    • ๋™์  ํ™˜๊ฒฝ์—์„œ์˜ ์‹œ์Šคํ…œ ๊ด€๋ จ์„ฑ ์œ ์ง€
    • ๋น ๋ฅธ ๋ฐ์ดํ„ฐ ์—…๋ฐ์ดํŠธ ์ฒ˜๋ฆฌ

2. RETRIEVAL-AUGMENTED GENERATION

์ฃผ์š” ๊ตฌ์„ฑ์š”์†Œ:

  • Retrieval Component (๊ฒ€์ƒ‰ ๊ตฌ์„ฑ์š”์†Œ)
  • Generation Component (์ƒ์„ฑ ๊ตฌ์„ฑ์š”์†Œ)

์ˆ˜ํ•™์  ์ •์˜ : 

  • $M = \{G, R = (\phi, \psi)\}$
  • $M(q; D) = G(q, \psi(q; \hat{D}))$
  • $\hat{D} = \phi(D)$
    • $G$: ์ƒ์„ฑ ๋ชจ๋“ˆ
    • $R$: ๊ฒ€์ƒ‰ ๋ชจ๋“ˆ
    • $q$: ์ž…๋ ฅ ์ฟผ๋ฆฌ
    • $D$: ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค
    • $\phi$: ๋ฐ์ดํ„ฐ ์ธ๋ฑ์„œ : ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค D๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํŠน์ • ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ $\hat{D}$๋ฅผ ๊ตฌ์ถ•ํ•˜๋Š” ์ž‘์—…์„ ํฌํ•จํ•จ
    • $\psi$: ๋ฐ์ดํ„ฐ ๊ฒ€์ƒ‰๊ธฐ : ์ธ๋ฑ์‹ฑ๋œ ๋ฐ์ดํ„ฐ์™€ ์ฟผ๋ฆฌ๋ฅผ ๋น„๊ตํ•˜์—ฌ ๊ด€๋ จ ๋ฌธ์„œ๋ฅผ ์–ป์œผ๋ฉฐ, ์ด๋ฅผ "๊ด€๋ จ ๋ฌธ์„œ"๋ผ๊ณ ํ•จ
  • ψ(·)๋ฅผ ํ†ตํ•ด ๊ฒ€์ƒ‰๋œ ์ •๋ณด์™€ ์ดˆ๊ธฐ ์ฟผ๋ฆฌ q๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๊ธ€๋กœ๋ฒŒ ์ •๋ณด๋ฅผ ํšจ์œจ์ ์œผ๋กœ ์ถ”์ถœ, ์ƒ์„ฑ ๋ชจ๋ธ G(·)๋Š” ๋งฅ๋ฝ์ ์œผ๋กœ ๊ด€๋ จ๋œ ์‘๋‹ต์„ ์ƒ์„ฑ

3. THE LIGHTRAG ARCHITECTURE

 

3.1 GRAPH-BASED TEXT INDEXING

Graph-Enhanced Entity and Relationship Extraction :

  • ๋ฌธ์„œ๋ฅผ ๋” ์ž‘์€ ์กฐ๊ฐ์œผ๋กœ ๋ถ„ํ• ํ•จ์œผ๋กœ์จ ๊ฒ€์ƒ‰ ์‹œ์Šคํ…œ์„ ํ–ฅ์ƒ(๊ด€๋ฆฌํ•˜๊ธฐ ์‰ฌ์›Œ์ง)
    -> ์ „์ฒด ๋ฌธ์„œ๋ฅผ ๋ถ„์„ํ•  ํ•„์š” ์—†์ด ๊ด€๋ จ ์ •๋ณด๋ฅผ ๋น ๋ฅด๊ฒŒ ์‹๋ณ„ํ•˜๊ณ  ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•จ.
  • LLM์„ ํ™œ์šฉํ•˜์—ฌ ๋‹ค์–‘ํ•œ ์—”ํ‹ฐํ‹ฐ(์˜ˆ: ์ด๋ฆ„, ๋‚ ์งœ, ์œ„์น˜, ์ด๋ฒคํŠธ)์™€ ์ด๋“ค ๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ์‹๋ณ„ํ•˜๊ณ  ์ถ”์ถœ
    -> ํฌ๊ด„์ ์ธ ์ง€์‹ ๊ทธ๋ž˜ํ”„๋ฅผ ๋งŒ๋“œ๋Š” ๋ฐ ์‚ฌ์šฉ
  • ์ด ๊ทธ๋ž˜ํ”„ ์ƒ์„ฑ ๋ชจ๋“ˆ์„ ๊ณต์‹์ ์œผ๋กœ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ํ‘œํ˜„:
    • $\hat{D} = (\hat{V}, \hat{E}) = Dedupe \circ Prof(V, E)\ \ \ \ V, E = \cup_{D_i \in D} Recog(D_i)$
      - $\hat{V}$ : ์ค‘๋ณต ์ œ๊ฑฐ๋œ ๋…ธ๋“œ ์ง‘ํ•ฉ
      - $\hat{E}$ : ์ค‘๋ณต ์ œ๊ฑฐ๋œ ์—ฃ์ง€ ์ง‘ํ•ฉ
      - Dedupe : Deduplicate
      - Prof(V, E) : ์ถ”์ถœ๋œ ์—”ํ‹ฐํ‹ฐ์™€ ๊ด€๊ณ„์— ๋Œ€ํ•œ ์ƒ์„ธ ์ •๋ณด ์ƒ์„ฑ
      - Recog : ๊ฐ ๋ฌธ์„œ์—์„œ ์—”ํ‹ฐํ‹ฐ์™€ ๊ด€๊ณ„๋ฅผ ์ธ์‹ํ•˜๋Š” ํ•จ์ˆ˜
    • ์ฒ˜๋ฆฌ ์ˆœ์„œ :
      1. Recog($D_i$) : ๊ฐ ๋ฌธ์„œ์—์„œ ์—”ํ‹ฐํ‹ฐ์™€ ๊ด€๊ณ„ ์ถ”์ถœ
      2. U : ๋ชจ๋“  ์ถ”์ถœ ๊ฒฐ๊ณผ ํ†ตํ•ฉ
      3. Prof : ํ†ตํ•ฉ๋œ ๊ฒฐ๊ณผ์— ๋Œ€ํ•œ ํ”„๋กœํŒŒ์ผ๋ง
      4. Dedupe : ์ค‘๋ณต ์ œ๊ฑฐ
      5. ์ตœ์ข… ๊ฒฐ๊ณผ : $\hat{D} = (\hat{V}, \hat{E})$
    • $\hat{D}$๋Š” ์ƒ์„ฑ๋œ ์ง€์‹ ๊ทธ๋ž˜ํ”„๋ฅผ ๋‚˜ํƒ€๋ƒ„.
      ์ด ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•˜๊ธฐ ์œ„ํ•ด, ํ…์ŠคํŠธ ๋ฌธ์„œ $D_i$์— ์„ธ ๊ฐ€์ง€ ์ฃผ์š” ์ฒ˜๋ฆฌ ๋‹จ๊ณ„๋ฅผ ์ ์šฉ(LLM์„ ์‚ฌ์šฉ)
      • ์—”ํ‹ฐํ‹ฐ ๋ฐ ๊ด€๊ณ„ ์ถ”์ถœ R(·) - Recog: LLM์„ ์‚ฌ์šฉํ•˜์—ฌ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ ๋‚ด์˜ ์—”ํ‹ฐํ‹ฐ(๋…ธ๋“œ)์™€ ๊ทธ๋“ค์˜ ๊ด€๊ณ„(์—ฃ์ง€)๋ฅผ ์ถ”์ถœ
        • ๋”๋ณด๊ธฐ
          - ์ž…๋ ฅ ํ…์ŠคํŠธ: "์‹ฌ์žฅ์ „๋ฌธ์˜ ๊น€์ฒ ์ˆ˜ ๊ต์ˆ˜๋Š” ์„œ์šธ๋Œ€ํ•™๊ต๋ณ‘์›์—์„œ ์‹ฌ์žฅ๋ณ‘ ํ™˜์ž๋“ค์„ ์ง„๋ฃŒํ•˜๊ณ  ์žˆ๋‹ค."

          ์ถ”์ถœ๋˜๋Š” ์ •๋ณด:
          1) ์—”ํ‹ฐํ‹ฐ:
              - ์‚ฌ๋žŒ: "๊น€์ฒ ์ˆ˜" (์ง์—…: ์‹ฌ์žฅ์ „๋ฌธ์˜, ์ง์œ„: ๊ต์ˆ˜)
              - ์กฐ์ง: "์„œ์šธ๋Œ€ํ•™๊ต๋ณ‘์›"
              - ์˜๋ฃŒ์กฐ๊ฑด: "์‹ฌ์žฅ๋ณ‘"

          2) ๊ด€๊ณ„:
              - "๊น€์ฒ ์ˆ˜ - ๊ทผ๋ฌด - ์„œ์šธ๋Œ€ํ•™๊ต๋ณ‘์›"
              - "๊น€์ฒ ์ˆ˜ - ์ง„๋ฃŒ - ์‹ฌ์žฅ๋ณ‘ ํ™˜์ž"
      • LLM Profiling์„ ํ†ตํ•œ Key-Value ์Œ ์ƒ์„ฑ. P(·): LLM ๊ธฐ๋ฐ˜ ํ”„๋กœํŒŒ์ผ๋ง ํ•จ์ˆ˜ P(·)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ V์˜ ๊ฐ ์—”ํ‹ฐํ‹ฐ ๋…ธ๋“œ์™€ E์˜ ๊ด€๊ณ„ ์—ฃ์ง€์— ๋Œ€ํ•œ ํ…์ŠคํŠธ key-value ์Œ (K, V)๋ฅผ ์ƒ์„ฑ.
        • ๊ฐ ์ธ๋ฑ์Šค ํ‚ค๋Š” ํšจ์œจ์ ์ธ ๊ฒ€์ƒ‰์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๋Š” ๋‹จ์–ด๋‚˜ ์งง์€ ๊ตฌ๋ฌธ์ด๋ฉฐ, ํ•ด๋‹นํ•˜๋Š” ๊ฐ’์€ ํ…์ŠคํŠธ ์ƒ์„ฑ์„ ๋•๊ธฐ ์œ„ํ•ด ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ์—์„œ ๊ด€๋ จ๋œ ์Šค๋‹ˆํŽซ์„ ์š”์•ฝํ•œ ํ…์ŠคํŠธ ๋‹จ๋ฝ
        • ์—”ํ‹ฐํ‹ฐ๋Š” ์ด๋ฆ„์„ ์œ ์ผํ•œ ์ธ๋ฑ์Šค ํ‚ค๋กœ ์‚ฌ์šฉํ•˜๋Š” ๋ฐ˜๋ฉด, ๊ด€๊ณ„๋Š” ์—ฌ๋Ÿฌ ์ธ๋ฑ์Šค ํ‚ค๋ฅผ ๊ฐ€์งˆ ์ˆ˜ ์žˆ๋‹ค.
        • ๋”๋ณด๊ธฐ
          ์—”ํ‹ฐํ‹ฐ์— ๋Œ€ํ•œ Key-Value ์ƒ์„ฑ
          1) ์—”ํ‹ฐํ‹ฐ: ์‚ผ์„ฑ์ „์ž
             Key: "์‚ผ์„ฑ์ „์ž"
             Value: "ํ•œ๊ตญ์˜ ๋Œ€ํ‘œ์ ์ธ ์ „์ž๊ธฐ์—…์œผ๋กœ, ์Šค๋งˆํŠธํฐ, ๊ฐ€์ „์ œํ’ˆ ๋“ฑ์„ ์ƒ์‚ฐํ•˜๋Š” ๊ธ€๋กœ๋ฒŒ ๊ธฐ์—…. 
                    ๊ฐค๋Ÿญ์‹œ ์‹œ๋ฆฌ์ฆˆ๋ฅผ ํ†ตํ•ด ์Šค๋งˆํŠธํฐ ์‹œ์žฅ์—์„œ ์„ ๋„์  ์œ„์น˜๋ฅผ ์ฐจ์ง€ํ•˜๊ณ  ์žˆ์Œ."

          2) ์—”ํ‹ฐํ‹ฐ: ๊ฐค๋Ÿญ์‹œ
             Key: "๊ฐค๋Ÿญ์‹œ"
             Value: "์‚ผ์„ฑ์ „์ž์˜ ๋Œ€ํ‘œ์ ์ธ ์Šค๋งˆํŠธํฐ ๋ธŒ๋žœ๋“œ๋กœ, 2024๋…„ ์‹ ํ˜• ๋ชจ๋ธ์ด ์ถœ์‹œ๋˜์–ด 
                    ์‹œ์žฅ์—์„œ ๋†’์€ ์„ฑ๊ณผ๋ฅผ ๊ธฐ๋ก. ํ˜์‹ ์ ์ธ ๊ธฐ์ˆ ๊ณผ ๋””์ž์ธ์œผ๋กœ ์ฃผ๋ชฉ๋ฐ›๋Š” ์ œํ’ˆ๊ตฐ."

          3) ์—”ํ‹ฐํ‹ฐ: ์Šค๋งˆํŠธํฐ ์‹œ์žฅ
             Key: "์Šค๋งˆํŠธํฐ_์‹œ์žฅ"
             Value: "๋ชจ๋ฐ”์ผ ๊ธฐ๊ธฐ ์‚ฐ์—…์˜ ํ•ต์‹ฌ ์‹œ์žฅ์œผ๋กœ, ๋‹ค์–‘ํ•œ ์ œ์กฐ์‚ฌ๋“ค์ด ๊ฒฝ์Ÿํ•˜๋Š” ๋ถ„์•ผ. 
                    ๊ธฐ์ˆ  ํ˜์‹ ๊ณผ ์†Œ๋น„์ž ์„ ํ˜ธ๋„์— ๋”ฐ๋ผ ๋น ๋ฅด๊ฒŒ ๋ณ€ํ™”ํ•˜๋Š” ํŠน์„ฑ์„ ๊ฐ€์ง."

          ๊ด€๊ณ„์— ๋Œ€ํ•œ Key-Value ์ƒ์„ฑ
          1) ๊ด€๊ณ„: ์‚ผ์„ฑ์ „์ž์˜ ๊ฐค๋Ÿญ์‹œ ์ถœ์‹œ
             Keys: ["์‚ผ์„ฑ_์‹ ์ œํ’ˆ", "๊ฐค๋Ÿญ์‹œ_์ถœ์‹œ", "์Šค๋งˆํŠธํฐ_๋Ÿฐ์นญ"]
             Value: "์‚ผ์„ฑ์ „์ž๊ฐ€ 2024๋…„ ์‹ ํ˜• ๊ฐค๋Ÿญ์‹œ ์Šค๋งˆํŠธํฐ์„ ์ถœ์‹œํ•˜์—ฌ ์‹œ์žฅ์— ์„ ๋ณด์ž„. 
                    ์‹ ์ œํ’ˆ์€ ์ตœ์‹  ๊ธฐ์ˆ ๊ณผ ํ˜์‹ ์  ๊ธฐ๋Šฅ์„ ํƒ‘์žฌํ•˜์—ฌ ์ฃผ๋ชฉ์„ ๋ฐ›์Œ."

          2) ๊ด€๊ณ„: ๊ฐค๋Ÿญ์‹œ์˜ ์‹œ์žฅ ์„ฑ๊ณผ
             Keys: ["๊ฐค๋Ÿญ์‹œ_์‹ค์ ", "์Šค๋งˆํŠธํฐ_๋งค์ถœ", "์‹œ์žฅ_์„ฑ๊ณผ"]
             Value: "์‹ ํ˜• ๊ฐค๋Ÿญ์‹œ๋Š” ์Šค๋งˆํŠธํฐ ์‹œ์žฅ์—์„œ ๋†’์€ ๋งค์ถœ์„ ๊ธฐ๋กํ•˜๋ฉฐ ์„ฑ๊ณต์ ์ธ ์‹œ์žฅ ๋ฐ˜์‘์„ ์–ป์Œ. 
                    ์ œํ’ˆ์˜ ํ˜์‹ ์„ฑ๊ณผ ๋ธŒ๋žœ๋“œ ๊ฐ€์น˜๊ฐ€ ์„ฑ๊ณผ์— ๊ธฐ์—ฌ."

          ์‹ค์ œ ์‚ฌ์šฉ ์˜ˆ์‹œ
          ์งˆ๋ฌธ: "2024๋…„ ๊ฐค๋Ÿญ์‹œ์˜ ์‹œ์žฅ ์„ฑ๊ณผ๋Š” ์–ด๋• ๋‚˜์š”?"
          ํ”„๋กœ์„ธ์Šค:
          1. "๊ฐค๋Ÿญ์‹œ_์‹ค์ ", "์Šค๋งˆํŠธํฐ_๋งค์ถœ" ๋“ฑ์˜ ํ‚ค๋ฅผ ํ†ตํ•ด ๊ด€๋ จ ์ •๋ณด ๊ฒ€์ƒ‰
          2. ๊ด€๋ จ๋œ Value๋“ค์„ ๊ฒฐํ•ฉํ•˜์—ฌ ๋‹ต๋ณ€ ์ƒ์„ฑ
          3. ํ•„์š”์‹œ ์—”ํ‹ฐํ‹ฐ ์ •๋ณด(์‚ผ์„ฑ์ „์ž, ๊ฐค๋Ÿญ์‹œ)๋ฅผ ์ถ”๊ฐ€ํ•˜์—ฌ ๋งฅ๋ฝ ๋ณด์™„
        • ๊ทธ๋ž˜ํ”„ ์—ฐ์‚ฐ ์ตœ์ ํ™”๋ฅผ ์œ„ํ•œ ์ค‘๋ณต ์ œ๊ฑฐ. D(·): ์›์ฒœ ํ…์ŠคํŠธ $D_i$์˜ ์„œ๋กœ ๋‹ค๋ฅธ ์„ธ๊ทธ๋จผํŠธ์—์„œ ๋™์ผํ•œ ์—”ํ‹ฐํ‹ฐ์™€ ๊ด€๊ณ„๋ฅผ ์‹๋ณ„ํ•˜๊ณ  ๋ณ‘ํ•ฉํ•˜๋Š” ์ค‘๋ณต ์ œ๊ฑฐ ํ•จ์ˆ˜ D(·)๋ฅผ ๊ตฌํ˜„(๊ตฌ์ฒด์ ์ธ ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด์„œ๋Š” ์„œ์ˆ ํ•˜์ง€ ์•Š์Œ)

3.2 DUAL-LEVEL RETRIEVAL PARADIGM

์ƒ์„ธํ•œ ๋ ˆ๋ฒจ๊ณผ ์ถ”์ƒ ๋ ˆ๋ฒจ ๋ชจ๋‘์—์„œ ์ฟผ๋ฆฌ ํ‚ค๋ฅผ ์ƒ์„ฑ(Profiling ๋‹จ๊ณ„์—์„œ ์ƒ์„ฑ)

  • ์ƒ์„ธํ•œ ์ฟผ๋ฆฌ: ์„ธ๋ถ€์‚ฌํ•ญ์„ ๋ฌป๋Š” ์ฟผ๋ฆฌ, ํŠน์ • ๋…ธ๋“œ๋‚˜ ์—ฃ์ง€์™€ ๊ด€๋ จ๋œ ์ •๋ณด์˜ ์ •ํ™•ํ•œ ๊ฒ€์ƒ‰์ด ํ•„์š” (์˜ˆ"'์˜ค๋งŒ๊ณผ ํŽธ๊ฒฌ'์„ ๋ˆ„๊ฐ€ ์ผ๋‚˜์š”?")
  • ์ถ”์ƒ ์ฟผ๋ฆฌ: ๋” ๊ฐœ๋…์ ์ด๋ฉฐ, ๋” ๋„“์€ ์ฃผ์ œ, ์š”์•ฝ, ๋˜๋Š” ์ „๋ฐ˜์ ์ธ ํ…Œ๋งˆ๋ฅผ ํฌ๊ด„. (์˜ˆ "์ธ๊ณต์ง€๋Šฅ์ด ํ˜„๋Œ€ ๊ต์œก์— ์–ด๋–ค ์˜ํ–ฅ์„ ๋ฏธ์น˜๋‚˜์š”?")

๋‘ ๊ฐ€์ง€ ๊ตฌ๋ถ„๋œ ๊ฒ€์ƒ‰ ์ „๋žต์„ ์‚ฌ์šฉ : ๋‹ค์–‘ํ•œ ์ฟผ๋ฆฌ ์œ ํ˜•์„ ์ˆ˜์šฉํ•˜๊ธฐ ์œ„ํ•ด

  • Low-Level ๊ฒ€์ƒ‰: ์ฃผ๋กœ ํŠน์ • ์—”ํ‹ฐํ‹ฐ์™€ ๊ทธ๋“ค์˜ ๊ด€๋ จ ์†์„ฑ์ด๋‚˜ ๊ด€๊ณ„๋ฅผ ๊ฒ€์ƒ‰ํ•˜๋Š” ๋ฐ ์ค‘์ . (์„ธ๋ถ€์‚ฌํ•ญ ์ง€ํ–ฅ์ )
  • High-Level ๊ฒ€์ƒ‰: ๋” ๋„“์€ ์ฃผ์ œ์™€ ์ „๋ฐ˜์ ์ธ ํ…Œ๋งˆ๋ฅผ ๋‹ค๋ฃฌ๋‹ค. ์ด ๋ ˆ๋ฒจ์˜ ์ฟผ๋ฆฌ๋Š” ์—ฌ๋Ÿฌ ๊ด€๋ จ ์—”ํ‹ฐํ‹ฐ์™€ ๊ด€๊ณ„์— ๊ฑธ์ณ ์ •๋ณด๋ฅผ ์ง‘๊ณ„ํ•˜์—ฌ, ํŠน์ • ์„ธ๋ถ€์‚ฌํ•ญ๋ณด๋‹ค๋Š” ๊ณ ์ฐจ์›์  ๊ฐœ๋…๊ณผ ์š”์•ฝ์— ๋Œ€ํ•œ ํ†ต์ฐฐ์„ ์ œ๊ณต
  • ๋”๋ณด๊ธฐ
    ์˜ˆ) Query : ์ „๊ธฐ ์ž๋™์ฐจ์˜ ์ฆ๊ฐ€๊ฐ€ ๋„์‹œ ๋Œ€๊ธฐ์งˆ๊ณผ ๋Œ€์ค‘๊ตํ†ต ์ธํ”„๋ผ์— ์–ด๋–ค ์˜ํ–ฅ์„ ๋ฏธ์น˜๋‚˜์š”?
    -> ์—”ํ‹ฐํ‹ฐ, ๊ด€๊ณ„ ์ถ”์ถœ
    -> ์—”ํ‹ฐํ‹ฐ(์ „๊ธฐ์ž๋™์ฐจ, ๋Œ€๊ธฐ์งˆ, ๋Œ€์ค‘๊ตํ†ต, ๋“ฑ...)
    -> ๊ด€๊ณ„(์ „๊ธฐ์ž๋™์ฐจ๊ฐ€ ๋Œ€๊ธฐ์งˆ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ, ...)

    ํ‚ค์›Œ๋“œ ์ƒ์„ฑ :
    Low-level : ์ „๊ธฐ์ž๋™์ฐจ, ๋Œ€๊ธฐ์งˆ, ๋Œ€์ค‘๊ตํ†ต
    High-level : ํ™˜๊ฒฝ ์˜ํ–ฅ, ๋„์‹œ ๊ณ„ํš, ๊ณต์ค‘ ๋ณด๊ฑด, ์ง€์†๊ฐ€๋Šฅ์„ฑ, ๋“ฑ..

ํšจ์œจ์ ์ธ ๊ฒ€์ƒ‰์„ ์œ„ํ•œ ๊ทธ๋ž˜ํ”„์™€ ๋ฒกํ„ฐ ํ†ตํ•ฉ : ๊ฒ€์ƒ‰ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ๋กœ์ปฌ ๋ฐ ๊ธ€๋กœ๋ฒŒ ํ‚ค์›Œ๋“œ๋ฅผ ๋ชจ๋‘ ํšจ๊ณผ์ ์œผ๋กœ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•˜์—ฌ ์„ฑ๋Šฅ ๋†’์•„์ง

  • (i) ์ฟผ๋ฆฌ ํ‚ค์›Œ๋“œ ์ถ”์ถœ: ์ฃผ์–ด์ง„ ์ฟผ๋ฆฌ q์— ๋Œ€ํ•ด, ๋กœ์ปฌ ์ฟผ๋ฆฌ ํ‚ค์›Œ๋“œ $k^{(l)}$์™€ ๊ธ€๋กœ๋ฒŒ ์ฟผ๋ฆฌ ํ‚ค์›Œ๋“œ $k^{(g)}$ ๋ชจ๋‘๋ฅผ ์ถ”์ถœ.
  • (ii) ํ‚ค์›Œ๋“œ ๋งค์นญ: ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋กœ์ปฌ ์ฟผ๋ฆฌ ํ‚ค์›Œ๋“œ๋ฅผ ํ›„๋ณด ์—”ํ‹ฐํ‹ฐ์™€ ๋งค์นญํ•˜๊ณ , ๊ธ€๋กœ๋ฒŒ ์ฟผ๋ฆฌ ํ‚ค์›Œ๋“œ๋ฅผ ๊ธ€๋กœ๋ฒŒ ํ‚ค์™€ ์—ฐ๊ฒฐ๋œ ๊ด€๊ณ„์™€ ๋งค์นญ
    -> ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์œผ๋กœ ๋ณด์•„ - V,E,D๋“ฑ์„ ๋ฒกํ„ฐํ™” ํ•œ ๊ฒƒ์œผ๋กœ ์ถ”์ธก
  • (iii) ๋†’์€ ๊ด€๋ จ์„ฑ ํ†ตํ•ฉ: ๊ฒ€์ƒ‰๋œ ๊ทธ๋ž˜ํ”„ ์š”์†Œ๋“ค์˜ ๋กœ์ปฌ ์„œ๋ธŒ๊ทธ๋ž˜ํ”„ ๋‚ด์˜ ์ด์›ƒ ๋…ธ๋“œ๋“ค์„ ์ถ”๊ฐ€๋กœ ์ˆ˜์ง‘. ์ด ํ”„๋กœ์„ธ์Šค๋Š” ์ง‘ํ•ฉ ${v_i|v_i \in V \wedge (v_i \in N_v \vee v_i \in N_e)}$๋ฅผ ํฌํ•จํ•˜๋ฉฐ, ์—ฌ๊ธฐ์„œ $N_v$์™€ $N_e$๋Š” ๊ฐ๊ฐ ๊ฒ€์ƒ‰๋œ ๋…ธ๋“œ v์™€ ์—ฃ์ง€ e์˜ ์›-ํ™‰ ์ด์›ƒ ๋…ธ๋“œ๋“ค์„ ๋‚˜ํƒ€๋‚ธ๋‹ค. ( ๋…ผ๋ฌธ์— ์˜ํ•˜๋ฉด 1 hop๋งŒ ํ•˜๋Š”๊ฒƒ์œผ๋กœ ๋ณด์ž„)
    ๋”๋ณด๊ธฐ
    - V : ์ „์ฒด ๊ทธ๋ž˜ํ”„์˜ ๋ชจ๋“  ๋…ธ๋“œ ์ง‘ํ•ฉ
    - v_i : V์˜ ๊ฐ ๊ฐœ๋ณ„ ๋…ธ๋“œ
    - ∧ : "V์— ์†ํ•˜๋ฉด์„œ"๋ผ๋Š” ์กฐ๊ฑด
    - N_v, N_e : Neighbor_v, Neighbor_e๋ฅผ ์˜๋ฏธ,

    [์ „์ฒด ๊ทธ๋ž˜ํ”„ ๊ตฌ์กฐ] : ๊ณ ํ˜ˆ์••์ด ์ฒซ ๋…ธ๋“œ์ธ ๊ฒฝ์šฐ.
               ์šด๋™
                 ↓
                 [์˜ˆ๋ฐฉ]
                 ↓
              ๋‘ํ†ต ←[์ฆ์ƒ]--- ๊ณ ํ˜ˆ์•• ---[์ฆ์ƒ]→ ์–ด์ง€๋Ÿฌ์›€
                               |
                             [์น˜๋ฃŒ]
                               ↓
                             ํ˜ˆ์••์•ฝ
                               |
                             [๊ด€๋ฆฌ]
                               |
                             ์ €์—ผ์‹

    1. $N_v$ (์ง์ ‘ ์ด์›ƒ):
    • ๊ณ ํ˜ˆ์•• ๋…ธ๋“œ์™€ ์ง์ ‘ ์—ฐ๊ฒฐ๋œ ๋…ธ๋“œ๋“ค
    • ๊ฒฐ๊ณผ: {๋‘ํ†ต, ์–ด์ง€๋Ÿฌ์›€, ํ˜ˆ์••์•ฝ}
    1. $N_e$ (๊ด€๊ณ„/์—ฃ์ง€๋กœ ์—ฐ๊ฒฐ๋œ ์ด์›ƒ):
    • "์˜ˆ๋ฐฉ", "๊ด€๋ฆฌ" ๋“ฑ์˜ ๊ด€๊ณ„๋ฅผ ํ†ตํ•ด ์—ฐ๊ฒฐ๋œ ๋…ธ๋“œ๋“ค
    • ๊ฒฐ๊ณผ: {์šด๋™, ์ €์—ผ์‹}

์ด dual-level ๊ฒ€์ƒ‰ ํŒจ๋Ÿฌ๋‹ค์ž„์€ ํ‚ค์›Œ๋“œ ๋งค์นญ์„ ํ†ตํ•ด ๊ด€๋ จ ์—”ํ‹ฐํ‹ฐ์™€ ๊ด€๊ณ„๋ฅผ ํšจ์œจ์ ์œผ๋กœ ๊ฒ€์ƒ‰ํ•  ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ๊ตฌ์„ฑ๋œ ์ง€์‹ ๊ทธ๋ž˜ํ”„์—์„œ ๊ด€๋ จ ๊ตฌ์กฐ์  ์ •๋ณด๋ฅผ ํ†ตํ•ฉํ•˜์—ฌ ๊ฒฐ๊ณผ์˜ ํฌ๊ด„์„ฑ์„ ํ–ฅ์ƒ.

 

3.3 RETRIEVAL-AUGMENTED ANSWER GENERATION

  • 3.1, 3.2, 3.3 ์ •๋ฆฌ
    1. ๊ทธ๋ž˜ํ”„ ๊ตฌ์ถ• (3.1์ ˆ)
       โ””โ”€โ”€ ํ…์ŠคํŠธ๋ฅผ ๊ทธ๋ž˜ํ”„ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋กœ ๋ณ€ํ™˜ ($\hat{D}$ ์ƒ์„ฑ)
           โ”œโ”€โ”€ ์—”ํ‹ฐํ‹ฐ ์ถ”์ถœ
           โ”œโ”€โ”€ ๊ด€๊ณ„ ์ถ”์ถœ
           โ””โ”€โ”€ ์ค‘๋ณต ์ œ๊ฑฐ ๋ฐ ์ตœ์ ํ™”

    2. ๊ฒ€์ƒ‰ ํ”„๋กœ์„ธ์Šค (3.2์ ˆ)
       โ””โ”€โ”€ ์ฟผ๋ฆฌ ์ฒ˜๋ฆฌ ๋ฐ ๊ด€๋ จ ์ •๋ณด ๊ฒ€์ƒ‰
           โ”œโ”€โ”€ Low-level ๊ฒ€์ƒ‰ (specific entities)
           โ”œโ”€โ”€ High-level ๊ฒ€์ƒ‰ (broader themes)
           โ””โ”€โ”€ ๊ทธ๋ž˜ํ”„-๋ฒกํ„ฐ ํ†ตํ•ฉ ๊ฒ€์ƒ‰

    3. ๋‹ต๋ณ€ ์ƒ์„ฑ (3.3์ ˆ)
       โ””โ”€โ”€ ์ตœ์ข… ์‘๋‹ต ์ƒ์„ฑ ํ”„๋กœ์„ธ์Šค
           โ”œโ”€โ”€ ๊ฒ€์ƒ‰๋œ ์ •๋ณด ๊ตฌ์กฐํ™”
           โ””โ”€โ”€ LLM ๊ธฐ๋ฐ˜ ์‘๋‹ต ์ƒ์„ฑ

  • ๊ฒ€์ƒ‰๋œ ์ •๋ณด์˜ ํ™œ์šฉ:
    • ๊ฒ€์ƒ‰๋œ ์ •๋ณด ψ(q; $\hat{D}$)๊ณผ LLM์„ ์‚ฌ์šฉ,
    • ์ด ๋ฐ์ดํ„ฐ๋Š” ํ”„๋กœํŒŒ์ผ๋ง ํ•จ์ˆ˜ P(·)์— ์˜ํ•ด ์ƒ์„ฑ๋œ ๊ด€๋ จ ์—”ํ‹ฐํ‹ฐ์™€ ๊ด€๊ณ„๋กœ๋ถ€ํ„ฐ์˜ ์—ฐ๊ฒฐ๋œ ๊ฐ’ V๋กœ ๊ตฌ์„ฑ.
      • ์—ฌ๊ธฐ์—๋Š” ์—”ํ‹ฐํ‹ฐ์™€ ๊ด€๊ณ„์˜ ์ด๋ฆ„, ์„ค๋ช…, ๊ทธ๋ฆฌ๊ณ  ์›๋ณธ ํ…์ŠคํŠธ์˜ ๋ฐœ์ทŒ๋ฌธ์ด ํฌํ•จ.(์•„๋ž˜ ์˜ˆ์‹œ ์ฐธ๊ณ )
    • ๋”๋ณด๊ธฐ
      # ์˜ˆ์‹œ ์ฟผ๋ฆฌ: "์ž์œจ์ฃผํ–‰ ์ž๋™์ฐจ์˜ ์•ˆ์ „ ์‹œ์Šคํ…œ์€ ์–ด๋–ป๊ฒŒ ์ž‘๋™ํ•˜๋‚˜์š”?"

      # ์›๋ณธ ํ…์ŠคํŠธ ์˜ˆ์‹œ:
      "ํ…Œ์Šฌ๋ผ์˜ ์ž์œจ์ฃผํ–‰ ์‹œ์Šคํ…œ์€ 8๊ฐœ์˜ ์นด๋ฉ”๋ผ์™€ 12๊ฐœ์˜ ์ดˆ์ŒํŒŒ ์„ผ์„œ๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.
      ๋ผ์ด๋‹ค ์„ผ์„œ๋Š” ๋ฌผ์ฒด๊นŒ์ง€์˜ ๊ฑฐ๋ฆฌ๋ฅผ ์ธก์ •ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.
      ์ž์œจ์ฃผํ–‰ ์ฐจ๋Ÿ‰์€ AI ๊ธฐ๋ฐ˜ ์ถฉ๋Œ ๋ฐฉ์ง€ ์‹œ์Šคํ…œ์„ ํ†ตํ•ด ๋ณดํ–‰์ž๋ฅผ ๊ฐ์ง€ํ•ฉ๋‹ˆ๋‹ค..."

      # 3.1 ๊ทธ๋ž˜ํ”„ ๊ตฌ์ถ• : ์—”ํ‹ฐํ‹ฐ ์ถ”์ถœ
      # ์—”ํ‹ฐํ‹ฐ ์ถ”์ถœ:
          - Entity1: ์ž์œจ์ฃผํ–‰ ์‹œ์Šคํ…œ
                  ์†์„ฑ: {์œ ํ˜•: "๊ธฐ์ˆ ", ๋ชฉ์ : "์ฐจ๋Ÿ‰ ์ œ์–ด"}
          - Entity2: ์„ผ์„œ
                  ์†์„ฑ: {์ข…๋ฅ˜: ["์นด๋ฉ”๋ผ", "์ดˆ์ŒํŒŒ", "๋ผ์ด๋‹ค"]}
          - Entity3: ์ถฉ๋Œ ๋ฐฉ์ง€ ์‹œ์Šคํ…œ
                  ์†์„ฑ: {์œ ํ˜•: "์•ˆ์ „", ๊ธฐ์ˆ : "AI"}
      # ๊ด€๊ณ„ ์ถ”์ถœ:
          - Relation1: (์ž์œจ์ฃผํ–‰ ์‹œ์Šคํ…œ) -[์‚ฌ์šฉ]-> (์„ผ์„œ)
          - Relation2: (์„ผ์„œ) -[๊ฐ์ง€]-> (๋ฌผ์ฒด/๋ณดํ–‰์ž)
          - Relation3: (์ถฉ๋Œ ๋ฐฉ์ง€ ์‹œ์Šคํ…œ) -[ํฌํ•จ]-> (์ž์œจ์ฃผํ–‰ ์‹œ์Šคํ…œ)


      # 3.2 ๊ฒ€์ƒ‰ ํ”„๋กœ์„ธ์Šค : 
      # ์ฟผ๋ฆฌ์—์„œ ํ‚ค์›Œ๋“œ ์ถ”์ถœ:
          - Low-level ํ‚ค์›Œ๋“œ: ["์ž์œจ์ฃผํ–‰", "์•ˆ์ „", "์‹œ์Šคํ…œ"]
          - High-level ํ‚ค์›Œ๋“œ: ["์ฐจ๋Ÿ‰ ์•ˆ์ „", "์„ผ์„œ ๊ธฐ์ˆ "]
      # ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ:
          - Low-level ๊ฒ€์ƒ‰:
              * ์ž์œจ์ฃผํ–‰ ์‹œ์Šคํ…œ
              * ์„ผ์„œ
              * ์ถฉ๋Œ ๋ฐฉ์ง€ ์‹œ์Šคํ…œ
          - High-level ๊ฒ€์ƒ‰:
              * ์•ˆ์ „ ๊ด€๋ จ ์‹œ์Šคํ…œ ๊ฐ„ ๊ด€๊ณ„
              * ์„ผ์„œ-์•ˆ์ „ ์—ฐ๊ด€ ์ •๋ณด

      # 3.3 ๋‹ต๋ณ€ ์ƒ์„ฑ : ๊ตฌ์กฐํ™”
      # ๊ตฌ์กฐํ™”๋œ ์ •๋ณด:
      {
          "core_systems": {
              "sensors": ["์นด๋ฉ”๋ผ", "์ดˆ์ŒํŒŒ", "๋ผ์ด๋‹ค"],
              "processing": "AI ๊ธฐ๋ฐ˜ ์ฒ˜๋ฆฌ",
              "safety_features": ["์ถฉ๋Œ ๋ฐฉ์ง€", "๋ฌผ์ฒด ๊ฐ์ง€"]
          },
          "relationships": {
              "sensor_safety": "์„ผ์„œ ๋ฐ์ดํ„ฐ → AI ์ฒ˜๋ฆฌ → ์•ˆ์ „ ๊ธฐ๋Šฅ ์ž‘๋™",
              "system_hierarchy": "์ž์œจ์ฃผํ–‰ ์‹œ์Šคํ…œ > ์ถฉ๋Œ ๋ฐฉ์ง€ > ์„ผ์„œ ์ž‘๋™"
          }
      }

      # ํ”„๋กœํŒŒ์ผ๋ง ํ•จ์ˆ˜ P(·)๊ฐ€ ์ˆ˜ํ–‰ํ•˜๋Š” ์ž‘์—…:
      1. ์—”ํ‹ฐํ‹ฐ ๋ถ„๋ฅ˜ ๋ฐ ๊ทธ๋ฃนํ™”
          - ํ•˜๋“œ์›จ์–ด ์š”์†Œ (sensors)
          - ์ฒ˜๋ฆฌ ์š”์†Œ (processing)
          - ๊ธฐ๋Šฅ์  ์š”์†Œ (safety_features)

      2. ๊ด€๊ณ„ ๋ถ„์„ ๋ฐ ๊ณ„์ธตํ™”
          - ์‹œ์Šคํ…œ ๊ฐ„ ์ƒํ˜ธ์ž‘์šฉ
          - ์ž‘๋™ ์ˆœ์„œ ๋ฐ ์˜์กด์„ฑ

 

๋งฅ๋ฝ ํ†ตํ•ฉ๊ณผ ๋‹ต๋ณ€ ์ƒ์„ฑ: retreiveํ•œ ์—”ํ‹ฐํ‹ฐ๋“ค, ๊ด€๊ณ„๋“ค, ์›๋ณธ ํ…์ŠคํŠธ๋ฅผ ๋ชจ์•„ LLM์œผ๋กœ ํ•˜์—ฌ๊ธˆ ์ข…ํ•ฉ์ ์ธ ๋‹ต๋ณ€ ์ƒ์„ฑ.

 

3.4 COMPLEXITY ANALYSIS OF THE LIGHTRAG FRAMEWORK(์ƒ๋žต)

 

4. Evaluation

  • (RQ1): ์ƒ์„ฑ ์„ฑ๋Šฅ ์ธก๋ฉด์—์„œ LightRAG๋Š” ๊ธฐ์กด RAG ๊ธฐ์ค€์„  ๋ฐฉ๋ฒ•๋“ค๊ณผ ์–ด๋–ป๊ฒŒ ๋น„๊ต๋˜๋Š”๊ฐ€?
  • (RQ2): dual-level ๊ฒ€์ƒ‰๊ณผ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์ธ๋ฑ์‹ฑ์€ ์–ด๋–ป๊ฒŒ LightRAG์˜ ์ƒ์„ฑ ํ’ˆ์งˆ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š”๊ฐ€?
  • (RQ3): LightRAG๋Š” ๋‹ค์–‘ํ•œ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ์–ด๋–ค ๊ตฌ์ฒด์ ์ธ ์žฅ์ ์„ ๋ณด์—ฌ์ฃผ๋Š”๊ฐ€?
  • (RQ4): LightRAG์™€ ๊ด€๋ จ๋œ ๋น„์šฉ์€ ๋ฌด์—‡์ด๋ฉฐ, ๋ฐ์ดํ„ฐ ๋ณ€ํ™”์— ๋Œ€ํ•œ ์ ์‘์„ฑ์€ ์–ด๋– ํ•œ๊ฐ€?

4.1 ์‹คํ—˜ ์„ค์ •

ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ ์…‹ : Agriculture, Legal, CS, Mixed

๋น„๊ต๊ตฐ : 

  • Naive RAG (Gao et al., 2023): ์ฝ”์‚ฌ์ธ ์œ ์‚ฌ๋„๊ฐ€ ๊ฐ€์žฅ ๋†’์€ ํ…์ŠคํŠธ ์ฒญํฌ ๊ฒ€์ƒ‰
  • RQ-RAG (Chan et al., 2024): LLM์„ ํ™œ์šฉํ•˜์—ฌ ์ž…๋ ฅ ์ฟผ๋ฆฌ๋ฅผ ์—ฌ๋Ÿฌ ํ•˜์œ„ ์ฟผ๋ฆฌ๋กœ ๋ถ„ํ•ด, ํ•˜์œ„ ์ฟผ๋ฆฌ๋“ค์€ ์žฌ์ž‘์„ฑ, ๋ถ„ํ•ด, ๋ชจํ˜ธ์„ฑ ํ•ด์†Œ์™€ ๊ฐ™์€ ๋ช…์‹œ์  ๊ธฐ๋ฒ•์„ ํ™œ์šฉํ•˜์—ฌ ๊ฒ€์ƒ‰ ์ •ํ™•๋„๋ฅผ ํ–ฅ์ƒ
  • HyDE (Gao et al., 2022): ์ž…๋ ฅ ์ฟผ๋ฆฌ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ฐ€์ƒ์˜ ๋ฌธ์„œ๋ฅผ ์ƒ์„ฑํ•˜๊ธฐ ์œ„ํ•ด LLM์„ ์‚ฌ์šฉ. ์ด ์ƒ์„ฑ๋œ ๋ฌธ์„œ๋Š” ๊ด€๋ จ ํ…์ŠคํŠธ ์ฒญํฌ๋ฅผ ๊ฒ€์ƒ‰ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋˜๋ฉฐ, ์ดํ›„ ์ตœ์ข… ๋‹ต๋ณ€์„ ๊ณต์‹ํ™”ํ•˜๋Š” ๋ฐ ํ™œ์šฉ
  • GraphRAG (Edge et al., 2024): LLM์„ ์‚ฌ์šฉํ•˜์—ฌ ํ…์ŠคํŠธ์—์„œ ์—”ํ‹ฐํ‹ฐ์™€ ๊ด€๊ณ„๋ฅผ ์ถ”์ถœํ•˜์—ฌ ๋…ธ๋“œ์™€ ์—ฃ์ง€๋กœ ํ‘œํ˜„. 

ํ‰๊ฐ€ ๋ฐฉ๋ฒ•(7.3.4) - GraphRag ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก  ์ฐจ์šฉ :

  • i) ํฌ๊ด„์„ฑ: ๋‹ต๋ณ€์ด ์งˆ๋ฌธ์˜ ๋ชจ๋“  ์ธก๋ฉด๊ณผ ์„ธ๋ถ€์‚ฌํ•ญ์„ ์–ผ๋งˆ๋‚˜ ์ฒ ์ €ํ•˜๊ฒŒ ๋‹ค๋ฃจ๋Š”๊ฐ€?
  • ii) ๋‹ค์–‘์„ฑ: ์งˆ๋ฌธ๊ณผ ๊ด€๋ จ๋œ ์„œ๋กœ ๋‹ค๋ฅธ ๊ด€์ ๊ณผ ํ†ต์ฐฐ์„ ์ œ๊ณตํ•˜๋Š” ๋ฐ ์žˆ์–ด ๋‹ต๋ณ€์ด ์–ผ๋งˆ๋‚˜ ๋‹ค์–‘ํ•˜๊ณ  ํ’๋ถ€ํ•œ๊ฐ€?
  • iii) ์ž„ํŒŒ์›Œ๋จผํŠธ: ๋‹ต๋ณ€์ด ๋…์ž๊ฐ€ ์ฃผ์ œ๋ฅผ ์ดํ•ดํ•˜๊ณ  ์ •๋ณด์— ์ž…๊ฐํ•œ ํŒ๋‹จ์„ ๋‚ด๋ฆฌ๋Š” ๊ฒƒ์„ ์–ผ๋งˆ๋‚˜ ํšจ๊ณผ์ ์œผ๋กœ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๋Š”๊ฐ€?
  • iv) ์ „๋ฐ˜์ : ์ด ์ฐจ์›์€ ์•ž์˜ ์„ธ ๊ฐ€์ง€ ๊ธฐ์ค€์— ๊ฑธ์นœ ๋ˆ„์  ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜์—ฌ ์ „๋ฐ˜์ ์œผ๋กœ ๊ฐ€์žฅ ์ข‹์€ ๋‹ต๋ณ€์„ ์‹๋ณ„
    - Pairwise ํ‰๊ฐ€ : ๋‘ ๋‹ต๋ณ€์„ ์ง์ ‘ ๋น„๊ตํ•˜๊ณ  ๊ฐ ๊ธฐ์ค€์— ๋Œ€ํ•ด ์šฐ์ˆ˜ํ•œ ์‘๋‹ต์„ ์„ ํƒ

 

4.2 Comparison of LightRAG with existing RAG Methods (RQ1)

  • ๋Œ€๊ทœ๋ชจ ์ฝ”ํผ์Šค์—์„œ ์šฐ์ˆ˜ํ•จ : LightRAG์™€ GraphRAG ๊ฐ™์€ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ์ด ๊ธฐ์กด ์ฒญํฌ ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•๋“ค๋ณด๋‹ค ์šฐ์ˆ˜
    ๋ฐ์ดํ„ฐ์…‹ ํฌ๊ธฐ๊ฐ€ ํด์ˆ˜๋ก ์„ฑ๋Šฅ ๊ฒฉ์ฐจ๊ฐ€ ๋” ์ฆ๊ฐ€
  • ๋‹ค์–‘์„ฑ ์ธก๋ฉด : Diversity ๋ฉ”ํŠธ๋ฆญ์—์„œ LightRAG๊ฐ€ ํ˜„์ €ํ•œ ์šฐ์œ„
    Dual-level ๊ฒ€์ƒ‰ ํŒจ๋Ÿฌ๋‹ค์ž„ ๋•๋ถ„์— ๋” ํฌ๊ด„์ ์ธ ์ •๋ณด ๊ฒ€์ƒ‰ ๊ฐ€๋Šฅ
  • GraphRAG์™€์˜ ๋น„๊ต : 
    ๋‘˜ ๋‹ค ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜์ด์ง€๋งŒ LightRAG๊ฐ€ ์ผ๊ด€๋˜๊ฒŒ ์šฐ์ˆ˜(๋ณต์žกํ•œ ์–ธ์–ด ๋งฅ๋ฝ ์ฒ˜๋ฆฌ์—์„œ ๋” ํšจ๊ณผ์ )

4.3 Ablation Studies(RQ2)

  • Dual-Level ๊ฒ€์ƒ‰ ํŒจ๋Ÿฌ๋‹ค์ž„ ํšจ๊ณผ์„ฑ : ๊ฐ๊ฐ ํ•˜๋‚˜์˜ ๋ชจ๋“ˆ์„ ์ œ๊ฑฐํ•œ๋’ค ํ‰๊ฐ€
    • Low-level๋กœ๋งŒ ๊ฒ€์ƒ‰(-High) : 
      • ๊ฑฐ์˜ ๋ชจ๋“  ๋ฐ์ดํ„ฐ์…‹, ๋ฉ”ํŠธ๋ฆญ์—์„œ ์ƒ๋‹นํ•œ ์„ฑ๋Šฅ ํ•˜๋ฝ ์žˆ์Œ.
      • ์ถ”์ธก : ํŠน์ • ์ •๋ณด(์—”ํ‹ฐํ‹ฐ)์— ๋Œ€ํ•ด ๊ณผ๋„ํ•˜๊ฒŒ ์ง‘์ค‘ํ•˜์—ฌ ๊ทธ๋Ÿฐ๊ฒƒ์œผ๋กœ ์ถ”์ธก. ํฌ๊ด„์ ์ธ ํ†ต์ฐฐ์ด ํ•„์š”ํ•œ ๋ถ€๋ถ„์—์„œ ์ •๋ณด ์ˆ˜์ง‘์ด ์–ด๋ ค์šด ๊ฒƒ์œผ๋กœ ๋ณด์ž„
    • High-level๋กœ๋งŒ ๊ฒ€์ƒ‰(-Low) : 
      • ํŠน์ • ์—”ํ‹ฐํ‹ฐ๋ฅผ ์‹ฌ๋„ ์žˆ๊ฒŒ ์กฐ์‚ฌํ•˜๋Š” ๋Šฅ๋ ฅ์ด ๊ฐ์†Œํ•˜์—ฌ, ์ƒ์„ธํ•œ ๋‹ต๋ณ€ ๋ถˆ๊ฐ€
    • ์›๋ณธ ํ…์ŠคํŠธ ์ œ๊ฑฐ (-Origin) : ๊ทธ๋ž˜ํ”„ ๊ตฌ์กฐ์—์„œ ์ถ”์ถœ๋œ ์ •๋ณด๋งŒ ์‚ฌ์šฉ
      • ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ์ธ๋ฑ์‹ฑ ํ”„๋กœ์„ธ์Šค ๋งŒ์œผ๋กœ๋„ ํ•ต์‹ฌ ์ •๋ณด ์ „๋‹ฌ ๊ฐ€๋Šฅ(์ฟผ๋ฆฌ์— ๋‹ต๋ณ€ํ•˜๊ธฐ์— ์ถฉ๋ถ„ํ•œ ๋งฅ๋ฝ ์ œ๊ณต)
      • ์›๋ณธ ํ…์ŠคํŠธ๋Š” ๋…ธ์ด์ฆˆ๋ฅผ ์œ ๋ฐœํ•  ์ˆ˜ ์žˆ๋Š” ๊ด€๋ จ ์—†๋Š” ์ •๋ณด ํฌํ•จ.

4.4 CaseStudy(RQ3) (์ƒ๋žต)

4.5 Model Cost and Adaptability Analysis (RQ4) (์ƒ๋žต)

5. Related Work ์ƒ๋žต

 

LightRAG์˜ˆ์‹œ

 

Graph ์ƒ์„ฑ ์˜ˆ์‹œ

Keyword ์ถ”์ถœ ์˜ˆ์‹œ

 

RAG Evaluation ์˜ˆ์‹œ

 

 

 

+ Recent posts