Summary

  1. ์šฉ์–ด ์ •๋ฆฌ
  • ์ธ๊ณต์ง€๋Šฅ
  • ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ(NLP)
  • LLM
  • Multi Modal
  1. LLM์˜ ํ•™์Šต ๋ฐฉ๋ฒ•
  • Fine Tuning
  • In Context Learning
  1. LLM์˜ ์„œ๋น„์Šค ๊ณผ์ •

์ด ๋…ธํŠธ๋Š” ์›๋ž˜ ๋ฐ์ดํ„ฐ ๋ถ„์„๊ณผ์ •์ค‘ Embedding์— ๊ด€๋ จํ•˜์—ฌ ๋…ธํŠธํ• ๋ ค๊ณ  ํ–ˆ์ง€๋งŒ LLM์˜ ์ •๋ฆฌ๋ฅผ ํ•˜๋ฉฐ ์ฐฌ์ฐฌํžˆ ๋‚˜์•„๊ฐ€๋„๋ก ํ•˜๊ฒ ๋‹ค.

1. ์šฉ์–ด ์ •๋ฆฌ

1) ์ธ๊ณต์ง€๋Šฅ

  • ํ•™์Šต ๋ฐ์ดํ„ฐ์˜ ์–‘์ด ๋งŽ์•„์ง์— ๋”ฐ๋ผ ์—ฐ์‚ฐ๋Ÿ‰์ด ๊ธฐํ•˜๊ธ‰์ˆ˜์ ์œผ๋กœ ์ปค์ง€๊ธฐ ๋•Œ๋ฌธ์— ์ด๋ฅผ ๊ฐ๋‹นํ•  ์ˆ˜ ์žˆ๋Š” ๋”ฅ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ๋ชจ๋ธ๋“ค์ด ๋งŽ์ด ์“ฐ์ด๊ณ  ์žˆ๋‹ค.
  • ์–ธ์–ด ๋ถ„์•ผ๋Š” ๊ตฌ๊ธ€์ด ๋งŒ๋“  Transformer ๊ธฐ๋ฐ˜ ๋ชจ๋ธ๋“ค์„ ํ™œ์šฉํ•œ๋‹ค.

Info

Transformer๋ž€?

  • Attention Is All You Need ๋…ผ๋ฌธ์—์„œ ๋ฐœํ‘œ๋œ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ ์ผ์ข…์ด๋‹ค.
  • ๋ฌธ์žฅ ์† ๋‹จ์–ด์™€ ๊ฐ™์€ ์ˆœ์ฐจ ๋ฐ์ดํ„ฐ ๋‚ด์˜ ๊ด€๊ณ„๋ฅผ ์ถ”์ ํ•ด ๋งฅ๋ฝ๊ณผ ์˜๋ฏธ๋ฅผ ํ•™์Šตํ•˜๋Š” ์‹ ๊ฒฝ๋ง์ด๋‹ค.
  • Attention Mechanism์€ ์ž…๋ ฅ ์‹œํ€€์Šค๊ฐ€ ๊ธธ์–ด์ง€๋ฉด ์ถœ๋ ฅ ์‹œํ€€์Šค์˜ ์ •ํ™•๋„๊ฐ€ ๋–จ์–ด์ง€๋Š” ๊ฒƒ์„ ๋ณด์ •ํ•ด์ฃผ๊ธฐ ์œ„ํ•œ ๊ธฐ๋ฒ•์ด๋‹ค.
  • Transformer ๋ชจ๋ธ์˜ ํŠน์ง•
    1. Attention Mechanism์œผ๋กœ ๋ชจ๋“  ๋‹จ์–ด๊ฐ„์˜ ์ƒํ˜ธ์ž‘์šฉ์„ ๋™์‹œ์— ๊ณ ๋ คํ•˜์—ฌ ๋ฌธ๋งฅ์„ ์ž˜ ํŒŒ์•…ํ•จ
    2. ๋ณ‘๋ ฌ ์ฒ˜๋ฆฌ ์—ฐ์‚ฐ์œผ๋กœ ์—ฐ์‚ฐ ์†๋„๊ฐ€ ๋น ๋ฆ„
    3. ์ž…์ถœ๋ ฅ ๊ธธ์ด๋ฅผ ์ž์œ ๋กญ๊ฒŒ ์„ค์ •ํ•  ์ˆ˜ ์žˆ์–ด ๋‹ค์–‘ํ•œ ๊ณผ์ œ(๋ฒˆ์—ญ, ์š”์•ฝ, Q&A๋“ฑ)์— ํ™œ์šฉ์ด ์šฉ์ดํ•จ
    4. ์‚ฌ์ „ ํ›ˆ๋ จ๋œ ๋ชจ๋ธ์— ์ƒˆ๋กœ์šด ํ•™์Šต ๋ฐ์ดํ„ฐ๋กœ ์žฌํ•™์Šตํ•˜๋Š” Transfer Learning(์ „์ด ํ•™์Šต) ์ด ๊ฐ€๋Šฅํ•จ

2) ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ(Natural Langauge Model, NLP)

  • ์ž์—ฐ์–ด๋ž€ ํ•œ๊ตญ์–ด, ์˜์–ด๋“ฑ์˜ ์‚ฌ๋žŒ๋“ค์ด ์ผ์ƒ์ ์œผ๋กœ ์“ฐ๋Š” ์–ธ์–ด๋ฅผ ์˜๋ฏธํ•œ๋‹ค.
  • ์‚ฌ๋žŒ๋“ค์ด ๋Œ€ํ™”ํ•˜๊ฑฐ๋‚˜ ๊ธฐ๋กํ•˜๋Š” ๋ฐ ์“ฐ์ด๋Š” ํ…์ŠคํŠธ๋“ค์„ ์ปดํ“จํ„ฐ๊ฐ€ ์ดํ•ดํ•˜๊ฒŒ ๋งŒ๋“ค๊ธฐ ์œ„ํ•ด ๊ฐ ์–ธ์–ด์˜ ํŠน์ง•์— ๋”ฐ๋ผ ์ˆ˜์น˜ ๋ฐ์ดํ„ฐ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ณผ์ •์„ ์—ฐ๊ตฌํ•˜๋Š” ๋ถ„์•ผ์ด๋‹ค.
  • ํ•œ๊ตญ์–ด์˜ ๊ฒฝ์šฐ ์˜์–ด๋ณด๋‹ค ํŠน๋ณ„ํ•œ ๊ทœ์น™(์กฐ์‚ฌ, ์–ด๋ฏธ, ๋งํˆฌ ๋“ฑ)์ด ๋งŽ๊ณ , โ€˜ํ•œ๊ตญ์–ด๋งŒ ์ฝ์„ ์ˆ˜ ์žˆ๋Š” ๋ฆฌ๋ทฐโ€™์ฒ˜๋Ÿผ ์ด์ƒํ•˜๊ฒŒ ์จ๋„ ์ดํ•ด๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค๋Š” ํŠน์ง•์ด ์žˆ์–ด ๋งค์šฐ ๊นŒ๋‹ค๋กœ์šด ์–ธ์–ด์ด๋‹ค.

3) LLM(Large Language Model)

  • ์–ต ๋‹จ์œ„ ์ด์ƒ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ด ํ•™์Šต๋œ ๊ฑฐ๋Œ€ ์–ธ์–ด ๋ชจ๋ธ๋กœ, ํ…์ŠคํŠธ๋ฅผ ์ž…๋ ฅํ•˜๋ฉด ๊ทธ์— ๋งž๋Š” ๋Œ€๋‹ต์„ ํ•˜๋Š” ํ…์ŠคํŠธ ์ƒ์„ฑ AI ๋ถ„์•ผ์ด๋‹ค.
  • ๋‹ค์–‘ํ•˜๊ฒŒ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๊ณ  ์ง๊ด€์ ์œผ๋กœ ํŽธ๋ฆฌํ•จ์„ ๋А๋‚„ ์ˆ˜ ์žˆ๋‹ค๋Š” ์žฅ์ ์ด ์žˆ๋‹ค.
  • ํ•˜์ง€๋งŒ, ๋Œ€์šฉ๋Ÿ‰์˜ ํ•™์Šต ๋ฐ์ดํ„ฐ์ธ ๋ชจ๋ธ์˜ ํฌ๊ธฐ๊ฐ€ ๋งค์šฐ ์ปค์„œ ๋งŽ์€ ์ž์›๊ณผ ์‹œ๊ฐ„์ด ํ•„์š”ํ•œ ๋ถ„์•ผ์ด๋‹ค.

4) Multi Modal(๋ฉ€ํ‹ฐ ๋ชจ๋‹ฌ)

  • ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ(Modality)๋Š” โ€˜์–‘์‹โ€™, โ€˜์–‘์ƒโ€™์ด๋ผ๋Š” ๋œป์ธ๋ฐ, ๋ณดํ†ต ์–ด๋–ค ํ˜•ํƒœ๋กœ ๋‚˜ํƒ€๋‚˜๋Š” ํ˜„์ƒ์ด๋‚˜ ๊ทธ๊ฒƒ์„ ๋ฐ›์•„๋“ค์ด๋Š” ๋ฐฉ์‹ ๋˜๋Š” ์ •๋ณด๋กœ ํ‘œํ˜„๋˜๊ฑฐ๋‚˜ ์ธ์‹๋˜๋Š” ํŠน์ •ํ•œ ํ˜•ํƒœ ๋˜๋Š” ๋ฐฉ์‹์„ ๋งํ•œ๋‹ค. ๋ฐ์ดํ„ฐ์˜ ํ˜•ํƒœ๋กœ ๋งํ•˜๋ฉด ํ…์ŠคํŠธ, ์˜ค๋””์˜ค, ์ด๋ฏธ์ง€ ๋“ฑ์ด ์žˆ๋‹ค.
  • Multi Modal์€ ์‹œ๊ฐ, ์ฒญ๊ฐ์„ ๋น„๋กฏํ•œ ์—ฌ๋Ÿฌ ์ธํ„ฐํŽ˜์ด์Šค๋ฅผ ํ†ตํ•ด์„œ ์ •๋ณด๋ฅผ ์ฃผ๊ณ ๋ฐ›๋Š” ๊ฒƒ์„ ๋งํ•˜๋Š” ๊ฐœ๋… ๋˜๋Š” ๋‹ค์–‘ํ•œ ํ˜•ํƒœ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์ž…๋ ฅ์„ ๋ฐ›์œผ๋ฉด ์ข…ํ•ฉ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•ด์„œ ๋‹ค์–‘ํ•œ ํ˜•ํƒœ๋กœ ์ถœ๋ ฅ์ด ๊ฐ€๋Šฅํ•œ ๊ธฐ์ˆ ์„ ์˜๋ฏธํ•œ๋‹ค.
  • Multi Modal AI๋Š” ๋‹ค์–‘ํ•œ ์ฑ„๋„์˜ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ๋ฅผ ๋™์‹œ์— ๋ฐ›์•„๋“ค์—ฌ์„œ ํ•™์Šตํ•˜๊ณ  ์‚ฌ๊ณ ํ•˜๋Š” AI ๋˜๋Š” ์ธ๊ฐ„์ด ์‚ฌ๋ฌผ์„ ๋ฐ›์•„๋“ค์ด๋Š” ๋‹ค์–‘ํ•œ ๋ฐฉ์‹๊ณผ ๋™์ผํ•˜๊ฒŒ ํ•™์Šตํ•˜๋Š” AI
  • Multi Modal ์˜ˆ์‹œ
    • ํ…์ŠคํŠธ, ์Œ์„ฑ, ์–ผ๊ตด ํ‘œ์ •์„ ํ†ตํ•ด ์ข…ํ•ฉ์ ์œผ๋กœ ์‚ฌ๋žŒ์˜ ๊ฐ์ •์„ ์ธ์‹
    • ์‹ฌ๋ฐ•์ˆ˜, ํ–‰๋™ ๋ฐ ์Œ์„ฑ์„ ํ†ตํ•ด ํ˜„์žฌ์˜ ๊ฑด๊ฐ•์ƒํƒœ๋ฅผ ํŒŒ์•…
    • ์ˆ˜์—… ๋‚ด์šฉ์„ ์˜์ƒ์œผ๋กœ ๋งŒ๋“ค๊ฑฐ๋‚˜ ์Œ์„ฑ์œผ๋กœ Q&A๋ฅผ ํ•˜๊ณ , ํ€ด์ฆˆ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ํ•™์Šต ํ”Œ๋žซํผํผ

2. LLM์˜ ํ•™์Šต ๋ฐฉ๋ฒ•

LLM์„ ํ•™์Šต์‹œํ‚ค๋Š” ๋ฐฉ๋ฒ•์—๋Š” 2๊ฐ€์ง€ ์žˆ๋‹ค.

  • Fine Tuning
  • In Context Learning(ICL)
Fine TuningIn Context Learning(ICL)
ํ•™์Šต ๋ฐฉ์‹ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์— ์ถ”๊ฐ€ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šต
โ†’ ๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ๋ฐ”๋€๋‹ค.
ํ”„๋กฌํ”„ํŠธ ๋‚ด์— ์ •๋ณด ๋˜๋Š” ์˜ˆ์‹œ๋ฅผ ์ œ๊ณตํ•˜์—ฌ ํ•™์Šต
โ†’ ๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ๋ฐ”๋€Œ์ง€ ์•Š๋Š”๋‹ค.
์žฅ์ ํŠน์ • ๋„๋ฉ”์ธ์— ๋Œ€ํ•œ ๋‹ต๋ณ€ ์„ ๋Šฅ ํ–ฅ์ƒ์‹œ๊ฐ„๊ณผ ๋น„์šฉ์ด ๋œ ํ•˜๋‹ค.
๋‹จ์ ์‹œ๊ฐ„๊ณผ ๋น„์šฉ์ด ๋งŽ์ด ํ•„์š”ํ•˜๋‹ค.์ž˜ ์„ค๊ณ„๋œ Prompt Engineering์ด ํ•„์š”ํ•˜๋‹ค.

1) Fine Tuning

  • Fine Tuning์€ ์ƒˆ๋กœ์šด ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ด ์‚ฌ์ „์— ํ•™์Šต๋œ LLM์„ ํ™œ์šฉํ•˜์—ฌ ์žฌํ•™์Šตํ•˜๋Š” ๊ฒƒ์„ ๋งํ•œ๋‹ค.
  • ๋ชจ๋ธ์ด ๋งค์šฐ ํฌ๊ธฐ ๋•Œ๋ฌธ์— ๋งŽ์€ GPU๊ฐ€ ํ•„์š”ํ•˜๋ฉฐ, ์ด๋Š” ํฐ ๋น„์šฉ์„ ์ดˆ๋ž˜ํ•œ๋‹ค.
  • ํŠน์ • ๋„๋ฉ”์ธ์— ๋Œ€ํ•œ LLM ์„œ๋น„์Šค๋ฅผ ๊ฐœ๋ฐœํ•  ๋•Œ ๋„๋ฉ”์ธ ์ตœ์ ํ™”๋ฅผ ์œ„ํ•ด ๋งŽ์ด ์“ฐ์ธ๋‹ค.(ex. ๊ธˆ์œต ๋“ฑ)
  • ์ œ๊ณตํ•˜๋ ค๋Š” ์„œ๋น„์Šค์— ๋”ฐ๋ผ ๋งŒ๋“œ๋Š” ํ•™์Šต ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ๊ฐ€ ๋‹ค๋ฅด๋ฉฐ, ๋ฐ์ดํ„ฐ์˜ Bias(ํŽธํ–ฅ์„ฑ), ์œค๋ฆฌ์„ฑ, ๊ด€๋ฆฌ ์ฒด๊ณ„ ๋“ฑ์ด ์ž˜ ๊ณ ๋ ค๋˜์–ด์•ผ ํ•œ๋‹ค.

2) In Context Learning

  • In Context Learning์€ LLM์— ์ž…๋ ฅํ•˜๋Š” ๊ฐ’์„ Prompt๋ผ๊ณ  ํ•˜๋Š”๋ฐ, LLM์ด ํ”„๋กฌํ”„ํŠธ ๋ฌธ๋งฅ์„ ํŒŒ์•…ํ•˜๊ณ , ๊ทธ ๋ฌธ๋งฅ์— ๋งž๊ฒŒ ์ถœ๋ ฅํ•˜๊ฒŒ ํ•˜๋Š” ๊ฒƒ์„ ๋งํ•œ๋‹ค.
  • Chat GPT๋ž‘ ์–˜๊ธฐํ•  ๋•Œ ๋งˆ์Œ์— ๋“ค์ง€ ์•Š๋Š” ๋‹ต๋ณ€์ด ๋‚˜์˜ค๋ฉด ์กฐ๊ฑด์„ ๋” ๋ถ™์ด๊ฑฐ๋‚˜ ๊ตฌ์ฒด์ ์œผ๋กœ ์„ค๋ช…ํ•ด์„œ ๋‹ค์‹œ ๋ฌผ์–ด๋ณด๋Š”๋ฐ ์ด ๊ณผ์ •์— ๋Œ€ํ•œ ๋ฐฉ๋ฒ•๋ก ์ด๋ผ๊ณ  ์ƒ๊ฐํ•˜๋ฉด ๋œ๋‹ค.
  • ์˜ˆ์‹œ
    • ์‚ผํ–‰์‹œ๋ฅผ ํ•˜๋Š” ๋กœ๋ด‡์„ ๋งŒ๋“œ๋Š” ์˜ˆ์‹œ
# Prompt 
์‚ผํ–‰์‹œ๋Š” ์„ธ๊ธ€์ž์ธ ๋‹จ์–ด๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ ๋‹จ์–ด์˜ ๊ฐ ๋ฌธ์ž๋กœ ์‹œ์ž‘๋˜๋Š” ์งง์€ ๊ธ€์„ ์ง“๋Š” ๊ฒŒ์ž„์„ ๋งํ•ด. '์‚ฌ์ด๋‹ค'๋กœ ์‚ผํ–‰์‹œ ํ•ด์ค˜
# Answer 
์‚ฌ๋ž‘ํ•˜๋Š” ์‚ฌ์ด๋‹ค์•ผ 
์ด๋ฆ„๋งŒ ๋“ค์–ด๋„ ์ƒํผํ•ด 
๋‹ค ๋งˆ์‹  ํ›„์—” ํ–‰๋ณต์ด ๊ฐ€๋“ํ•ด
  • ํ•œ ๋ฒˆ ๋ฌผ์–ด๋ณผ ๋•Œ ์ž‘์„ฑ์ž๊ฐ€ ์›ํ•˜๋Š” ๋‹ต์„ ์ •ํ™•ํ•˜๊ฒŒ ์–ป๋Š” ๊ธฐ์ˆ ์„ Zero-Shot Learning์ด๋ผ๊ณ  ํ•œ๋‹ค.
  • ๊ทธ๋Ÿฌ๋‚˜ ๋˜‘๊ฐ™์€ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์—ฌ๋Ÿฌ ๋ฒˆ ์‹คํ–‰์‹œ์ผœ๋ณด๋ฉด, ๊ทธ ์„ฑ๋Šฅ์ด ์ข‹์ง€ ์•Š๋‹ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.
์‚ฌ๋ž‘์Šค๋Ÿฌ์šด 
์‚ฌ์ด๋‹ค ํ•œ์ž” 
์‚ฐ๋œปํ•œ ํ•˜๋ฃจ ์‹œ์ž‘
  • ์ผ๊ด€์„ฑ์ด ๋–จ์–ด์ง€๋Š” Zero-Shot-Learning์„ ๋ณด์™„ํ•˜๊ธฐ ์œ„ํ•ด ์˜ˆ์‹œ๋ฅผ ์ œ๊ณตํ•˜๋Š” ๊ฒƒ์„ N-Shot Learning์ด๋ผ๊ณ  ํ•œ๋‹ค.
  • N์€ ์ œ๊ณตํ•˜๋Š” ์˜ˆ์‹œ์˜ ์ˆ˜
# Prompt
์‚ผํ–‰์‹œ๋Š” ์„ธ๊ธ€์ž์ธ ๋‹จ์–ด๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ ๋‹จ์–ด์˜ ๊ฐ ๋ฌธ์ž๋กœ ์‹œ์ž‘๋˜๋Š” ์งง์€ ๊ธ€์„ ์ง“๋Š” ๊ฒŒ์ž„์„ ๋งํ•ด.
Q: '์ž์ „๊ฑฐ'๋กœ ์‚ผํ–‰์‹œ ํ•ด์ค˜
์ž: ์ž์œ ๋กœ์šด ๋งˆ์Œ์œผ๋กœ ์„ธ์ƒ์„ ๋ˆ„๋น„๋Š”
์ „: ์ „์ง„ํ•˜๋Š” ๋ฐœ๊ฑธ์Œ์— ํž˜์„ ์‹ค์–ด์ฃผ๋Š”
๊ฑฐ: ๊ฑฐ์นœ ์„ธ์ƒ๋„ ํ—ค์ณ๋‚˜๊ฐ€๋Š” ์šฉ๊ธฐ๋ฅผ ์ฃผ๋Š” ์ž์ „๊ฑฐ
Q: '์‚ฌ์ด๋‹ค'๋กœ ์‚ผํ–‰์‹œ ํ•ด์ค˜
# Answer
์‚ฌ: ์‚ฌ๋ž‘์Šค๋Ÿฌ์šด ๋ง›์œผ๋กœ ์ž…๊ฐ€๋ฅผ ์ฆ๊ฒ๊ฒŒ ํ•˜๋Š” 
์ด: ์ด์Šฌ์ฒ˜๋Ÿผ ์‹œ์›ํ•œ ์–ผ์Œ๊ณผ ํ•จ๊ป˜ ๋งˆ์‹œ๋Š”
๋‹ค: ๋‹ค์–‘ํ•œ ์ข…๋ฅ˜๋กœ ์ฆ๊ธธ ์ˆ˜ ์žˆ๋Š” ์ƒ์พŒํ•œ ์‚ฌ์ด๋‹ค
  • ๋‘ ๋ฒˆ ๋งŒ์— ์‚ผํ–‰์‹œ์—์„œ ๋ฒ—์–ด๋‚œ ๋‹ต๋ณ€์ด ๋‚˜์™”๋‹ค๋ฉด, ์ด๋ฒˆ์—๋Š” ์ž‘์„ฑ์ž๊ฐ€ ์›ํ•˜๋Š” ๋Œ€๋กœ ํ˜•ํƒœ๊ฐ€ ์œ ์ง€๋˜์„œ ๋‚˜์˜จ ๊ฒƒ์„ ๋ณผ ์ˆ˜ ์žˆ๋‹ค.

  • ํ•˜์ง€๋งŒ, ๋” ๋‹ค์–‘ํ•œ ํ‘œํ˜„๋“ค์ด ๋‚˜์™”์œผ๋ฉด ์ข‹๊ฒ ์ง€๋งŒ ์˜ˆ์‹œ ๋‚ด์šฉ๊ณผ ๋น„์Šทํ•œ ๊ฐ์„ฑ์ ์ธ ํ‘œํ˜„๋“ค์ด ๋‚˜์˜ค๊ณ  ์ œ์‹œ๋œ ์˜ˆ์‹œ์ฒ˜๋Ÿผ โ€˜~ํ•œ ์‚ฌ์ด๋‹คโ€™์™€ ๊ฐ™์€ ๊ฐ™์€ ๊ตฌ์กฐ๋ฅผ ์“ด๋‹ค.

  • ์ด์ฒ˜๋Ÿผ ์ œ๊ณต๋˜๋Š” ์ •๋ณด๊ฐ€ ํ•œ ์ชฝ์— ์น˜์šฐ์ณ์ ธ ์žˆ๋Š” ๊ฒƒ์„ Bias(ํŽธํ–ฅ) ๋ผ๊ณ  ํ•œ๋‹ค.

  • Bias(ํŽธํ–ฅ) ์€ LLM์„ ํ•™์Šต์‹œํ‚ฌ ๋•Œ ์ค‘์š”ํ•˜๊ฒŒ ๊ณ ๋ คํ•ด์•ผ ํ•˜๋Š” ์š”์†Œ์ด๋‹ค.

3. LLM์˜ ์„œ๋น„์Šค ๊ณผ์ •

โ‘  ๋‚ด๊ฐ€ ๊ฐ€์ง„ ์ •๋ณด๋ฅผ ๋ฐ์ดํ„ฐ๋กœ ์ €์žฅ

  • Text Split
    • ์ •๋ณด์˜ ๊ธธ์ด๊ฐ€ ๋งค์šฐ ๊ธธ๋ฉด ์ด๋ฅผ ์ชผ๊ฐœ์„œ ๊ด€๋ฆฌํ•˜๊ฒŒ ๋œ๋‹ค.
    • ์–ด๋–ค ๊ธฐ์ค€์œผ๋กœ ์ชผ๊ฐค ๊ฒƒ์ธ๊ฐ€์— ๋Œ€ํ•œ ๋ฐฉ๋ฒ•๋ก ์ด ๋‹ค์–‘ํ•˜๊ฒŒ ์กด์žฌํ•œ๋‹ค.
  • Embedding
    • ๋ฌธ์ž๋ฅผ ๋ถ„์„ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ˆซ์ž ๋ฒกํ„ฐ๋กœ ๋ฐ”๊ฟ”์ฃผ๋Š”๋ฐ ์ด๋ฅผ Embedding(์ž„๋ฒ ๋”ฉ)์ด๋ผ๊ณ  ํ•œ๋‹ค.
    • ํŠนํžˆ ํ•œ๊ตญ์–ด๋Š” ํƒ€ ์–ธ์–ด์™€ ๋‹ฌ๋ฆฌ ์กฐ์‚ฌ, ์–ด๋ฏธ, ์‹œ์ œ ๋“ฑ ๋ณต์žกํ•ด์„œ Embedding model์ด ์ค‘์š”ํ•˜๋‹ค.
    • ๋ชจ๋ธ์ด ๋ณต์žกํ• ์ˆ˜๋ก ์ž„๋ฒ ๋”ฉํ•˜๋Š” ์‹œ๊ฐ„์ด ๊ธธ์–ด์ง€๊ธฐ ๋•Œ๋ฌธ์— ๋ฏธ๋ฆฌ ๋ฐ”๊ฟ” DB์— ์ €์žฅํ•œ๋‹ค.
    • Embedding๋œ ๋ฐ์ดํ„ฐ๋ฅผ ์ €์žฅํ•˜๊ฒŒ ๋˜๋ฉด ๋‚˜์ค‘์— ์œ ์‚ฌ๋„๋ฅผ ๋น ๋ฅด๊ฒŒ ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ๋‹ค.

โ‘ก, โ‘ข ์œ ์‚ฌ๋„ ๊ฒ€์ƒ‰

  • DB์—์„œ ์‚ฌ์šฉ์ž์˜ Question๊ณผ ๊ด€๋ จ ์žˆ๋Š” ๋‚ด์šฉ๋“ค์„ ์ถ”์ถœํ•˜๋Š” ๊ณผ์ •์ด๋‹ค.
  • Vector DB
    • ์ž„๋ฒ ๋”ฉ๋œ ๋ฐ์ดํ„ฐ๋“ค์„ ์ €์žฅํ•˜๋Š” ์ €์žฅ์†Œ๋‹ค.
    • ๋น ๋ฅด๊ฒŒ ์กฐํšŒํ•˜๊ณ , ์œ ์‚ฌ๋„๋ฅผ ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ๋Š” ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋“ค์ด ๊ณ„์†ํ•ด์„œ ๋“ฑ์žฅํ•˜๊ณ  ์žˆ๋‹ค.
    • Ex) FAISS, ChromaDB, ElasticSearch ๋“ฑ
  • RAG(Retriever Augmented Generator)
    • ๊ธฐ์กด์— ๊ฐ€์ง€๊ณ  ์žˆ๋Š” DB์—์„œ ์‚ฌ์šฉ์ž๊ฐ€ ์งˆ๋ฌธํ•œ ๋‚ด์šฉ๊ณผ ๊ด€๋ จ๋œ ๋‚ด์šฉ๋“ค์„ ์ถ”์ถœํ•œ ๋‹ค์Œ ๊ทธ ์ •๋ณด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ Prompt์— ๋งž์ถฐ ๋Œ€๋‹ตํ•˜๊ฒŒ ํ•˜๋Š” ๊ธฐ์ˆ 
    • Hallucination์€ LLM์ด ๋‚ด์šฉ์— ๋Œ€ํ•ด ๋ชจ๋ฅด๋Š”๋ฐ๋„ ๊ฑฐ์ง“์œผ๋กœ ๋‹ต๋ณ€ํ•˜๋Š” ํ˜„์ƒ์ด๋‹ค.
    • RAG๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ์ •๋ณด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋Œ€๋‹ตํ•˜๊ธฐ ๋•Œ๋ฌธ์— LLM์ด ์ž์‹ ์ด ์•Œ๊ณ  ์‹ถ์ง€ ์•Š๋‹ค๋Š” ๊ฒƒ์„ ์ธ์‹ํ•˜๊ณ  โ€˜๊ทธ ๋ถ€๋ถ„์€ ํ•™์Šตํ•˜์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค. ๋Œ€๋‹ตํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค.โ€˜์˜ ๋‹ต๋ณ€์„ ํ•˜๊ฒŒ ํ•  ์ˆ˜ ์žˆ๋‹ค.

โ‘ฃ, โ‘ค ์ถ”์ถœ๋œ ๋ฌธ์„œ์™€ ์‚ฌ์šฉ์ž์˜ ์งˆ๋ฌธ์„ LLM์— ์ž…๋ ฅ

  • ์—ฌ๋Ÿฌ ์ •๋ณด๋“ค์„ ํ˜ผํ•ฉํ•˜์—ฌ Question์„ ์ƒˆ๋กญ๊ฒŒ ๋งŒ๋“  ๋‹ค์Œ LLM์— ์ž…๋ ฅํ•˜๋Š” ๊ณผ์ •์ด๋‹ค.
  • Prompt
    • Prompt๋Š” ๋‚ด๊ฐ€ LLM์—๊ฒŒ ์ •๋ณด๋ฅผ ์ฃผ๋ฉด์„œ ์ด๋ ‡๊ฒŒ ์ถœ๋ ฅํ•ด๋‹ฌ๋ผ๊ณ  ๋งํ•˜๋Š” ์ง€์‹œ๋ฌธ์ด๋‹ค.
    • โ€˜์งˆ๋ฌธ + ์งˆ๋ฌธ๊ณผ ์œ ์‚ฌํ•œ ๋ฌธ์„œ๋“ค + ๋ณ„๋„์˜ ์ง€์‹œโ€™๋ฅผ ํฌํ•จํ•˜์—ฌ ํ…œํ”Œ๋ฆฟ์„ ๋งŒ๋“  ํ›„ LLM์— ์ž…๋ ฅํ•œ๋‹ค.

Reference

PPS ์—ฐ๊ตฌ์›๋‹˜์˜ LLM_์ „์ฒด์ ์ธ ๋‚ด์šฉ ์ •๋ฆฌ NVIDIA ํŠธ๋žœ์Šคํฌ๋จธ ๋ชจ๋ธ์ด๋ž€ ๋ฌด์—‡์ธ๊ฐ€? (1) WikiDocs_Attention Mechanism ์‚ผ์„ฑ SDS Multi Modal