โ† ๐Ÿ“š ์ด๋ฒˆ ์ฃผ Weekly Digest๋กœ ๋Œ์•„๊ฐ€๊ธฐ

DD-060 DataFlex: A Unified Framework for Data-Centric Dynamic Training of Large Language Models

arXiv: 2603.26164 ๊ธฐ๊ด€: Peking University Upvotes: 152 | Comments: 4 ์ˆœ์œ„: ์ด๋ฒˆ ์ฃผ Top 5


๋…ผ๋ฌธ ๋ฆฌ๋ทฐ: DataFlex: A Unified Framework for Data-Centric Dynamic Training of Large Language Models

1. ์™œ ์ด ๋…ผ๋ฌธ์ด ์ค‘์š”ํ•œ๊ฐ€?

๊ธฐ์กด์˜ ๋ฐ์ดํ„ฐ ์ค‘์‹ฌ ํ•™์Šต(Data-Centric Training) ๋ฐฉ๋ฒ•๋“ค์€ ๋ฐ์ดํ„ฐ ์„ ๋ณ„, ํ˜ผํ•ฉ, ๊ฐ€์ค‘์น˜ ์กฐ์ • ๋“ฑ์ด ๊ฐ๊ธฐ ๋‹ค๋ฅธ ์ฝ”๋“œ๋ฒ ์ด์Šค๋กœ ํŒŒํŽธํ™”๋˜์–ด ์žˆ์–ด, ์—ฐ๊ตฌ์ž๋“ค ๊ฐ„์˜ ๊ณต์ •ํ•œ ๋น„๊ต์™€ ์‹ค๋ฌด ์ ์šฉ์ด ๋งค์šฐ ์–ด๋ ค์› ์Šต๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€ ์ด๋Ÿฌํ•œ ํŒŒํŽธํ™” ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด LLaMA-Factory ๊ธฐ๋ฐ˜์˜ ํ†ตํ•ฉ๋œ ํ”„๋ ˆ์ž„์›Œํฌ์ธ DataFlex๋ฅผ ์ œ์‹œํ•˜๋ฉฐ, ๋ฐ์ดํ„ฐ๋ฅผ ๋‹จ์ˆœํ•œ ์ž์›์ด ์•„๋‹Œ ์ตœ์ ํ™”์˜ ํ•ต์‹ฌ ๋ณ€์ˆ˜๋กœ ๊ด€๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ํ™˜๊ฒฝ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

2. ํ•ต์‹ฌ ์•„์ด๋””์–ด ์‰ฝ๊ฒŒ ์ดํ•ดํ•˜๊ธฐ

์Šค๋งˆํŠธํ•œ ๊ฐœ์ธ ํŠธ๋ ˆ์ด๋„ˆ์— ๋น„์œ ํ•˜๊ธฐ

์ด ๋…ผ๋ฌธ์˜ ํ•ต์‹ฌ ์•„์ด๋””์–ด๋ฅผ โ€˜์šด๋™๊ณผ ๊ฐœ์ธ ํŠธ๋ ˆ์ด๋„ˆโ€™์— ๋น„์œ ํ•ด ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์ธ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM) ํ•™์Šต์€ ๋งˆ์น˜ ์šด๋™ ์„ ์ˆ˜์—๊ฒŒ ์ฃผ์–ด์ง„ โ€˜๊ต๋ณธ ์ „์ฒดโ€™๋ฅผ ๋ฌด์กฐ๊ฑด ์ฒ˜์Œ๋ถ€ํ„ฐ ๋๊นŒ์ง€ ์ฝ๊ณ  ์™ธ์šฐ๊ฒŒ ํ•˜๋Š” ๊ฒƒ๊ณผ ๋น„์Šทํ•ฉ๋‹ˆ๋‹ค. ์„ ์ˆ˜๊ฐ€ ์ด๋ฏธ ์•Œ๊ณ  ์žˆ๋Š” ๋ถ€๋ถ„์ด๋“ , ๋„ˆ๋ฌด ์–ด๋ ค์›Œ์„œ ์•„์ง ์ดํ•ดํ•  ์ˆ˜ ์—†๋Š” ๋ถ€๋ถ„์ด๋“  ์ƒ๊ด€์—†์ด ๋ชจ๋“  ๋‚ด์šฉ์„ ๋˜‘๊ฐ™์€ ๋น„์ค‘์œผ๋กœ ๊ณต๋ถ€ํ•˜๊ฒŒ ํ•˜๋Š” ๊ฒƒ์ด์ฃ .

๋ฐ˜๋ฉด, DataFlex๋Š” ์˜†์—์„œ ์ง€์ผœ๋ณด๋Š” โ€˜์Šค๋งˆํŠธํ•œ ๊ฐœ์ธ ํŠธ๋ ˆ์ด๋„ˆโ€™์™€ ๊ฐ™์Šต๋‹ˆ๋‹ค. ํŠธ๋ ˆ์ด๋„ˆ๋Š” ์„ ์ˆ˜๊ฐ€ ์šด๋™์„ ํ•˜๋Š” ๋ชจ์Šต(ํ•™์Šต ๊ณผ์ •)์„ ์‹ค์‹œ๊ฐ„์œผ๋กœ ๊ด€์ฐฐํ•˜๋ฉด์„œ ์ƒํ™ฉ์— ๋งž์ถฐ ๋™์ ์œผ๋กœ ๋Œ€์‘ํ•ฉ๋‹ˆ๋‹ค. ์„ ์ˆ˜์˜ ๊ทผ์œก(๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ)์ด ์–ด๋А ๋ถ€๋ถ„์— ์•ฝํ•œ์ง€ ํŒŒ์•…ํ•˜์—ฌ, ๋”ฑ ํ•„์š”ํ•œ ๋™์ž‘๋งŒ ๊ณจ๋ผ์„œ ์ง‘์ค‘ ์—ฐ์Šต์‹œํ‚ค๊ฑฐ๋‚˜(Dynamic Sample Selection), ์œ ์‚ฐ์†Œ์™€ ๊ทผ๋ ฅ ์šด๋™์˜ ๋น„์œจ์„ ์‹ค์‹œ๊ฐ„์œผ๋กœ ์กฐ์ ˆํ•˜๊ณ (Domain Mixture Adjustment), ๋” ์ค‘์š”ํ•œ ๋™์ž‘์—๋Š” ๋ฐ˜๋ณต ํšŸ์ˆ˜๋ฅผ ๋Š˜๋ ค์ฃผ๋Š”(Sample Reweighting) ์‹์ž…๋‹ˆ๋‹ค.

๋‹จ๊ณ„๋ณ„ ๋™์ž‘ ๋ฐฉ์‹

DataFlex๋Š” ํ•™์Šต์ด ์ง„ํ–‰๋˜๋Š” ๋™์•ˆ ์„ธ ๊ฐ€์ง€ ์ฃผ์š” ๊ธฐ๋Šฅ์„ ํ†ตํ•ด ๋ฐ์ดํ„ฐ๋ฅผ ๋™์ ์œผ๋กœ ์ œ์–ดํ•ฉ๋‹ˆ๋‹ค. ์ฒซ์งธ, โ€˜์ƒ˜ํ”Œ ์„ ๋ณ„โ€™ ๋‹จ๊ณ„์—์„œ๋Š” ๋ชจ๋ธ ํ•™์Šต์— ๊ฐ€์žฅ ๋„์›€์ด ๋˜๋Š” ๋ฐ์ดํ„ฐ๋งŒ ๊ณจ๋ผ๋ƒ…๋‹ˆ๋‹ค. ๋งˆ์น˜ ํ€ด์ฆˆ ๊ณต๋ถ€๋ฅผ ํ•  ๋•Œ ์ด๋ฏธ ๋งž์ถ˜ ๋ฌธ์ œ๋Š” ๊ฑด๋„ˆ๋›ฐ๊ณ  ํ‹€๋ฆฐ ๋ฌธ์ œ ์œ„์ฃผ๋กœ ๋‹ค์‹œ ๊ณต๋ถ€ํ•˜๋Š” ๊ฒƒ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. ์ด๋•Œ ๊ทธ๋ผ๋””์–ธํŠธ(Gradient)๋‚˜ ์ž„๋ฒ ๋”ฉ(Embedding) ๊ฐ™์€ ์‹ ํ˜ธ๋ฅผ ์‚ฌ์šฉํ•ด ๋ฐ์ดํ„ฐ์˜ ์œ ์šฉ์„ฑ์„ ํŒ๋‹จํ•ฉ๋‹ˆ๋‹ค.

๋‘˜์งธ, โ€˜๋„๋ฉ”์ธ ํ˜ผํ•ฉ ์กฐ์ •โ€™์€ ๋ฐ์ดํ„ฐ์˜ ์ข…๋ฅ˜(์˜ˆ: ์ˆ˜ํ•™, ์ฝ”๋”ฉ, ์ผ์ƒ ๋Œ€ํ™” ๋“ฑ) ๋น„์œจ์„ ํ•™์Šต ์ค‘๊ฐ„์— ๋ฐ”๊ฟ€ ์ˆ˜ ์žˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ์ฒ˜์Œ์—๋Š” ๊ธฐ์ดˆ๋ฅผ ๋‹ค์ง€๊ธฐ ์œ„ํ•ด ์ผ์ƒ ๋Œ€ํ™”๋ฅผ ๋งŽ์ด ํ•˜๋‹ค๊ฐ€, ์‹ค๋ ฅ์ด ๋Š˜๋ฉด ์ˆ˜ํ•™ ๋ฌธ์ œ ๋น„์ค‘์„ ๋Š˜๋ฆฌ๋Š” ์‹์œผ๋กœ ์ „๋žต์„ ์ˆ˜์ •ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์…‹์งธ, โ€˜์ƒ˜ํ”Œ ์žฌ๊ฐ€์ค‘์น˜โ€™๋Š” ๊ฐ ๋ฐ์ดํ„ฐ์˜ ์ค‘์š”๋„๋ฅผ ๋‹ค๋ฅด๊ฒŒ ์„ค์ •ํ•ฉ๋‹ˆ๋‹ค. ์‹œํ—˜์— ์ž์ฃผ ๋‚˜์˜ค๋Š” ํ•ต์‹ฌ ๊ฐœ๋…์€ ๊ฐ€์ค‘์น˜๋ฅผ ๋†’์—ฌ์„œ ๋ชจ๋ธ์ด ๋” ๊นŠ๊ฒŒ ํ•™์Šตํ•˜๊ฒŒ ํ•˜๊ณ , ์žก์Œ์ด ๋งŽ์€ ๋ฐ์ดํ„ฐ๋Š” ๊ฐ€์ค‘์น˜๋ฅผ ๋‚ฎ์ถฐ์„œ ํ•™์Šต์„ ๋ฐฉํ•ดํ•˜์ง€ ์•Š๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ๋ฉ”์ปค๋‹ˆ์ฆ˜

๊ธฐ์ˆ ์ ์œผ๋กœ DataFlex๋Š” ๊ธฐ์กด์˜ LLaMA-Factory ํ›ˆ๋ จ ๊ณ„์ธต์„ ํ™•์žฅ ๊ฐ€๋Šฅํ•œ ํŠธ๋ ˆ์ด๋„ˆ ์ถ”์ƒํ™”(Trainer Abstraction)๋กœ ๋Œ€์ฒดํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋ณ„๋„์˜ ์™ธ๋ถ€ ํŒŒ์ดํ”„๋ผ์ธ ์—†์ด๋„ ํ›ˆ๋ จ ๋ฃจํ”„ ๋‚ด๋ถ€์—์„œ ๋ฐ์ดํ„ฐ ์ตœ์ ํ™” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋ชจ๋“ˆ ํ˜•ํƒœ๋กœ ์‰ฝ๊ฒŒ ๋ผ์›Œ ๋„ฃ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ฆ‰, ๋ชจ๋ธ์ด ํ•™์Šตํ•˜๋ฉด์„œ ๋‚ด๋ฑ‰๋Š” ์ค‘๊ฐ„ ์‹ ํ˜ธ๋“ค(๋กœ์Šค, ์ž„๋ฒ ๋”ฉ ๋“ฑ)์„ ํšจ์œจ์ ์œผ๋กœ ๊ด€๋ฆฌํ•˜๊ณ , ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋‹ค์Œ์— ํ•™์Šตํ•  ๋ฐ์ดํ„ฐ๋ฅผ ์ฆ‰์‹œ ๊ฒฐ์ •ํ•˜๋Š” ๊ตฌ์กฐ๋ฅผ ๊ฐ–์ถ”๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

3. ์‹คํ—˜ ๊ฒฐ๊ณผ ๋ถ„์„

์—ฐ๊ตฌ์ง„์€ DataFlex ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํ†ตํ•ด 7๊ฐ€์ง€ ๋ฐ์ดํ„ฐ ์„ ๋ณ„ ์•Œ๊ณ ๋ฆฌ์ฆ˜, 2๊ฐ€์ง€ ๋ฐ์ดํ„ฐ ํ˜ผํ•ฉ ์•Œ๊ณ ๋ฆฌ์ฆ˜, 1๊ฐ€์ง€ ๋ฐ์ดํ„ฐ ์žฌ๊ฐ€์ค‘์น˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํฌ๊ด„์ ์œผ๋กœ ์‹คํ—˜ํ–ˆ์Šต๋‹ˆ๋‹ค. ์‹คํ—˜์€ Open-Hermes-2.5 ๋ฐ์ดํ„ฐ์…‹์˜ 10๋งŒ ๊ฐœ ์˜ˆ์ œ๋ฅผ ์‚ฌ์šฉํ•ด ์ง„ํ–‰๋˜์—ˆ์œผ๋ฉฐ, ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์€ MMLU ๋ฒค์น˜๋งˆํฌ๋ฅผ ํ†ตํ•ด ๊ฒ€์ฆ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

๊ตฌ์ฒด์ ์œผ๋กœ Mistral-7B-v0.1๊ณผ Llama-3.2-3B ๋‘ ๊ฐ€์ง€ ๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜๋ฅผ ๋Œ€์ƒ์œผ๋กœ ํŒŒ๋ผ๋ฏธํ„ฐ ํšจ์œจ์  ๋ฏธ์„ธ ์กฐ์ •(PEFT) ๊ธฐ๋ฒ•์ธ LoRA๋ฅผ ์ ์šฉํ•˜์—ฌ ํ…Œ์ŠคํŠธํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ, ์˜จ๋ผ์ธ ๋ฐ์ดํ„ฐ ์„ ๋ณ„ ๋ฐฉ์‹์ธ LESS์™€ NICE ๊ฐ™์€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ๋žœ๋ค ์„ ๋ณ„์ด๋‚˜ ์ •์ ์ธ ์˜คํ”„๋ผ์ธ ๋ฐฉ์‹์— ๋น„ํ•ด ์›”๋“ฑํžˆ ํšจ์œจ์ ์ž„์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค. ์ „์ฒด 10๋งŒ ๊ฐœ ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ๋‘ ์‚ฌ์šฉํ•˜๋Š” Full-data ํ›ˆ๋ จ๊ณผ ๋น„๊ตํ–ˆ์„ ๋•Œ๋„, DataFlex๋ฅผ ํ†ตํ•ด ์„ ๋ณ„๋œ ํ•ต์‹ฌ ๋ฐ์ดํ„ฐ๋งŒ์œผ๋กœ ํ•™์Šตํ•œ ๋ชจ๋ธ์ด ์œ ์‚ฌํ•˜๊ฑฐ๋‚˜ ๋” ๋‚˜์€ ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉฐ ํ•™์Šต ์‹œ๊ฐ„์„ ๋‹จ์ถ•ํ•  ์ˆ˜ ์žˆ์Œ์„ ํ™•์ธํ–ˆ์Šต๋‹ˆ๋‹ค.

์ด ๋…ผ๋ฌธ์˜ ๊ฐ€์žฅ ํฐ ์„ฑ๊ณผ๋Š” ๋‹จ์ˆœํžˆ ์„ฑ๋Šฅ ์ˆ˜์น˜ ํ–ฅ์ƒ ๊ทธ ์ด์ƒ์ž…๋‹ˆ๋‹ค. ์„œ๋กœ ๋‹ค๋ฅธ ์ธํ„ฐํŽ˜์ด์Šค๋ฅผ ๊ฐ€์ง„ ์—ฌ๋Ÿฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ•˜๋‚˜์˜ ํ†ตํ•ฉ๋œ ํ”„๋ ˆ์ž„์›Œํฌ์—์„œ ์‹คํ–‰ํ•ด ๋ด„์œผ๋กœ์จ, ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ฐ„์˜ ๊ณต์ •ํ•œ ์„ฑ๋Šฅ ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•ด์กŒ๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. ์ด๋Š” ํ–ฅํ›„ ๋ฐ์ดํ„ฐ ์ค‘์‹ฌ ํ•™์Šต ์—ฐ๊ตฌ์˜ ์žฌํ˜„์„ฑ๊ณผ ์‹ ๋ขฐ์„ฑ์„ ํฌ๊ฒŒ ๋†’์ด๋Š” ๊ฒฐ์‹ค์„ ๋งบ์—ˆ์Šต๋‹ˆ๋‹ค.

4. ํ•œ๊ณ„์ ๊ณผ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

์ €์ž๋“ค์€ DataFlex๊ฐ€ ํ•™์Šต ๋ฃจํ”„ ๋‚ด์—์„œ ๋ฐ์ดํ„ฐ ์ตœ์ ํ™”๋ฅผ ์ˆ˜ํ–‰ํ•จ์— ๋”ฐ๋ผ, ๋‹จ์ˆœํ•œ ์ •์  ํ•™์Šต์— ๋น„ํ•ด ๊ณ„์‚ฐ ์˜ค๋ฒ„ํ—ค๋“œ(Computational Overhead)๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Œ์„ ์ธ์ •ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ์˜ ์œ ์šฉ์„ฑ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด ์ถ”๊ฐ€์ ์ธ ์ถ”๋ก (Inference)์ด๋‚˜ ๊ทธ๋ผ๋””์–ธํŠธ ๊ณ„์‚ฐ์ด ํ•„์š”ํ•˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.

ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ์œผ๋กœ๋Š” ์ด๋Ÿฌํ•œ ๊ณ„์‚ฐ ๋น„์šฉ์„ ์ตœ์†Œํ™”ํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ฐœ๋ฐœ๊ณผ ๋”๋ถˆ์–ด, ํ˜„์žฌ์˜ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋ฅผ ๋„˜์–ด ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ(Multimodal) ๋ฐ์ดํ„ฐ๊นŒ์ง€ ํ™•์žฅํ•  ์ˆ˜ ์žˆ๋Š” ์‹œ์Šคํ…œ ์„ค๊ณ„๊ฐ€ ์ œ์•ˆ๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ๋” ๋Œ€๊ทœ๋ชจ์˜ ๋ถ„์‚ฐ ํ•™์Šต ํ™˜๊ฒฝ์—์„œ์˜ ์•ˆ์ •์„ฑ๊ณผ ํ™•์žฅ์„ฑ์„ ๊ฒ€์ฆํ•˜๋Š” ์ž‘์—…๋„ ๋‚จ์•„ ์žˆ์Šต๋‹ˆ๋‹ค.

5. ์‹ค๋ฌด ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ

DataFlex๋Š” ๊ณ ํ’ˆ์งˆ์˜ ์ •๋ (Alignment) ๋ฐ์ดํ„ฐ๊ฐ€ ๋ถ€์กฑํ•˜๊ฑฐ๋‚˜, ๋…ธ์ด์ฆˆ๊ฐ€ ๋งŽ์€ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹์„ ํšจ์œจ์ ์œผ๋กœ ์ •์ œํ•˜๊ณ  ์‹ถ์€ ๊ธฐ์—…์ด๋‚˜ ์—ฐ๊ตฌ์†Œ์— ๋ฐ”๋กœ ์ ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ LLaMA-Factory๋ฅผ ์ด๋ฏธ ์‚ฌ์šฉ ์ค‘์ธ ํŒ€์ด๋ผ๋ฉด ๋“œ๋กญ์ธ(Drop-in) ๋ฐฉ์‹์œผ๋กœ ๊ต์ฒด๋งŒ ํ•˜๋ฉด ๋˜๋ฏ€๋กœ ๋งˆ์ด๊ทธ๋ ˆ์ด์…˜ ๋น„์šฉ์ด ๋งค์šฐ ๋‚ฎ์Šต๋‹ˆ๋‹ค.

ํ•„์š”ํ•œ ๋ฆฌ์†Œ์Šค ์ธก๋ฉด์—์„œ๋Š” ๋ชจ๋ธ ํ›ˆ๋ จ์„ ์œ„ํ•œ GPU๋Š” ๋‹น์—ฐํžˆ ํ•„์š”ํ•˜๋ฉฐ, ๋ฐ์ดํ„ฐ ์„ ๋ณ„ ์•Œ๊ณ ๋ฆฌ์ฆ˜(ํŠนํžˆ ์˜จ๋ผ์ธ ๋ฐฉ์‹)์„ ์‹คํ–‰ํ•˜๊ธฐ ์œ„ํ•œ ์ถ”๊ฐ€์ ์ธ ์—ฐ์‚ฐ ์ž์›์ด ์†Œ๋ชจ๋ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์žฅ๊ธฐ์ ์œผ๋กœ๋Š” ๋ถˆํ•„์š”ํ•œ ๋ฐ์ดํ„ฐ ํ•™์Šต์„ ์ค„์—ฌ์ฃผ์–ด ์ „์ฒด ํ›ˆ๋ จ ์‹œ๊ฐ„๊ณผ ๋น„์šฉ์„ ์ ˆ๊ฐํ•  ์ˆ˜ ์žˆ๋Š” ์ž ์žฌ๋ ฅ์ด ํฝ๋‹ˆ๋‹ค.

6. ์ด ๋…ผ๋ฌธ์„ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•œ ์‚ฌ์ „ ์ง€์‹

  • ๋ฐ์ดํ„ฐ ์ค‘์‹ฌ AI(Data-Centric AI): ๋ชจ๋ธ ๊ตฌ์กฐ๋ณด๋‹ค๋Š” ๋ฐ์ดํ„ฐ์˜ ํ’ˆ์งˆ๊ณผ ์–‘์„ ๊ฐœ์„ ํ•˜์—ฌ ์‹œ์Šคํ…œ ์„ฑ๋Šฅ์„ ๋†’์ด๋Š” ์ ‘๊ทผ ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค.
  • LLaMA-Factory: ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์„ ํšจ์œจ์ ์œผ๋กœ ๋ฏธ์„ธ ์กฐ์ •ํ•  ์ˆ˜ ์žˆ๋„๋ก ๋„์™€์ฃผ๋Š” ํ†ตํ•ฉ ํˆดํ‚ท์ž…๋‹ˆ๋‹ค.
  • ๋ฏธ์„ธ ์กฐ์ •(Fine-Tuning): ์ด๋ฏธ ์‚ฌ์ „ ํ•™์Šต๋œ ๋Œ€๊ทœ๋ชจ ๋ชจ๋ธ์„ ํŠน์ • ์ž‘์—…์ด๋‚˜ ๋ฐ์ดํ„ฐ์…‹์— ๋งž์ถฐ ์ถ”๊ฐ€์ ์œผ๋กœ ํ•™์Šต์‹œํ‚ค๋Š” ๊ณผ์ •์ž…๋‹ˆ๋‹ค.
  • LoRA(Low-Rank Adaptation): ๋ชจ๋ธ์˜ ์ „์ฒด ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์—…๋ฐ์ดํŠธํ•˜์ง€ ์•Š๊ณ , ์ ์€ ์ˆ˜์˜ ์ถ”๊ฐ€ ํŒŒ๋ผ๋ฏธํ„ฐ๋งŒ ํ•™์Šต์‹œ์ผœ ํšจ์œจ์ ์œผ๋กœ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๋Š” ๊ธฐ๋ฒ•์ž…๋‹ˆ๋‹ค.
  • ๊ทธ๋ผ๋””์–ธํŠธ(Gradient): ์‹ ๊ฒฝ๋ง ํ•™์Šต ์‹œ ์†์‹ค ํ•จ์ˆ˜๋ฅผ ์ตœ์†Œํ™”ํ•˜๊ธฐ ์œ„ํ•ด ๊ฐ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์กฐ์ •ํ•ด์•ผ ํ•  ๋ฐฉํ–ฅ๊ณผ ํฌ๊ธฐ๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ๊ฐ’์ž…๋‹ˆ๋‹ค.
  • ์ถ”๋ก (Inference): ํ•™์Šต์ด ์™„๋ฃŒ๋œ ๋ชจ๋ธ์ด ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ์˜ˆ์ธก์ด๋‚˜ ๊ฒฐ๊ณผ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๊ณผ์ •์ž…๋‹ˆ๋‹ค.
  • MMLU(Massive Multitask Language Understanding): ์–ธ์–ด ๋ชจ๋ธ์˜ ์ง€์‹๊ณผ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์˜ ๋ฌธ์ œ๋ฅผ ํ†ตํ•ด ํ‰๊ฐ€ํ•˜๋Š” ๋ฒค์น˜๋งˆํฌ์ž…๋‹ˆ๋‹ค.

๐Ÿ“š ์ด๋ฒˆ ์ฃผ ๊ด€๋ จ Deep Dive

์ˆœ์œ„๋…ผ๋ฌธDeep Dive
๐Ÿฅ‡CARLA-Air: Fly Drones Inside a CARLโ€ฆDD-056
๐ŸฅˆFIPO: Eliciting Deep Reasoning withโ€ฆDD-057
๐Ÿฅ‰ClawKeeper: Comprehensive Safety Prโ€ฆDD-058
4.ShotStream: Streaming Multi-Shot Viโ€ฆDD-059
5.DataFlex: A Unified Framework for Dโ€ฆ๐Ÿ“ ํ˜„์žฌ ๋ฌธ์„œ

๐Ÿ“… ์ƒ์„ฑ์ผ: 2026-04-05 | ๐Ÿค– GLM-4.7 Deep Dive