โ† ๐Ÿ“š ์ด๋ฒˆ ์ฃผ Weekly Digest๋กœ ๋Œ์•„๊ฐ€๊ธฐ

DD-047 InCoder-32B: Code Foundation Model for Industrial Scenarios

arXiv: 2603.16790 ๊ธฐ๊ด€: Beihang University Upvotes: 290 | Comments: 4 ์ˆœ์œ„: ์ด๋ฒˆ ์ฃผ Top 2


์•ˆ๋…•ํ•˜์„ธ์š”. AI/ML ์ „๋ฌธ๊ฐ€๋กœ์„œ ์ด ํฅ๋ฏธ๋กœ์šด ๋…ผ๋ฌธ์„ ๊นŠ์ด ์žˆ๊ฒŒ ๋ถ„์„ํ•ด ๋“œ๋ฆฌ๊ฒ ์Šต๋‹ˆ๋‹ค. ์ฃผ๋‹ˆ์–ด ๊ฐœ๋ฐœ์ž๋ถ„๋“ค๋„ ์‰ฝ๊ฒŒ ์ดํ•ดํ•˜์‹ค ์ˆ˜ ์žˆ๋„๋ก ํ˜„์‹ค์ ์ธ ๋น„์œ ๋ฅผ ๋“ค์–ด ์„ค๋ช…ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค.


1. ์™œ ์ด ๋…ผ๋ฌธ์ด ์ค‘์š”ํ•œ๊ฐ€?

๊ธฐ์กด์˜ ๊ฑฐ๋Œ€ ์–ธ์–ด ๋ชจ๋ธ๋“ค์€ ์ผ๋ฐ˜์ ์ธ ์†Œํ”„ํŠธ์›จ์–ด ๊ฐœ๋ฐœ(์›น ์„œ๋น„์Šค, ์•ฑ ๋งŒ๋“ค๊ธฐ ๋“ฑ)์—์„œ๋Š” ๋›ฐ์–ด๋‚œ ์„ฑ๊ณผ๋ฅผ ๋ณด์˜€์ง€๋งŒ, ์นฉ ์„ค๊ณ„๋‚˜ GPU ์ปค๋„ ์ตœ์ ํ™”์™€ ๊ฐ™์€ ๋ณต์žกํ•œ ์‚ฐ์—… ํ˜„์žฅ์—์„œ๋Š” ํ•˜๋“œ์›จ์–ด์˜ ๋ฌผ๋ฆฌ์  ์ œ์•ฝ๊ณผ ์ „๋ฌธ์ ์ธ ์–ธ์–ด๋ฅผ ์ดํ•ดํ•˜์ง€ ๋ชปํ•ด ์„ฑ๋Šฅ์ด ๊ธ‰๊ฒฉํžˆ ๋–จ์–ด์ง€๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€ ์ผ๋ฐ˜์ ์ธ ์ฝ”๋”ฉ ๋Šฅ๋ ฅ์„ ์œ ์ง€ํ•˜๋ฉด์„œ๋„, ํ•˜๋“œ์›จ์–ด ์˜๋ฏธ๋ก ๊ณผ ์ž์› ์ œ์•ฝ์„ ์ถ”๋ก ํ•  ์ˆ˜ ์žˆ๋Š” ์ตœ์ดˆ์˜ 320์–ต ํŒŒ๋ผ๋ฏธํ„ฐ ๊ทœ๋ชจ ์‚ฐ์—…์šฉ ์ฝ”๋“œ ๋ชจ๋ธ์ธ InCoder-32B๋ฅผ ์ œ์‹œํ•˜์—ฌ ์ด ๊ฒฉ์ฐจ๋ฅผ ํ•ด๊ฒฐํ–ˆ์Šต๋‹ˆ๋‹ค.

2. ํ•ต์‹ฌ ์•„์ด๋””์–ด ์‰ฝ๊ฒŒ ์ดํ•ดํ•˜๊ธฐ

์ผ์ƒ์ƒํ™œ ๋น„์œ : โ€˜๋งŒ๋Šฅ ์š”๋ฆฌ์‚ฌโ€™ vs โ€˜ํŠน์ˆ˜ ์žฅ๋น„ ์ •๋น„์‚ฌโ€™

๊ธฐ์กด์˜ ์ฝ”๋“œ ๋ชจ๋ธ์€ ๋งˆ์น˜ ์„ธ๊ณ„ ๊ฐ๊ตญ์˜ ์š”๋ฆฌ๋ฅผ ์ž˜ํ•˜๋Š” โ€˜๋งŒ๋Šฅ ์š”๋ฆฌ์‚ฌโ€™์™€ ๊ฐ™์Šต๋‹ˆ๋‹ค. ํŒŒ์Šคํƒ€๋‚˜ ํŒŒ์ด์ฌ ์Šคํฌ๋ฆฝํŠธ๋ฅผ ๋งŒ๋“œ๋Š” ๋ฐ๋Š” ๋Šฅ์ˆ™ํ•˜์ง€๋งŒ, ์ •๋น„์†Œ์—์„œ ์—”์ง„์„ ๋œฏ์–ด ๊ณ ์น˜๊ฑฐ๋‚˜ ๋ฐ˜๋„์ฒด ๊ณต์žฅ ๋ผ์ธ์„ ์ œ์–ดํ•˜๋Š” ๋ฐ ํ•„์š”ํ•œ ์ „๋ฌธ ์ง€์‹์€ ๋ถ€์กฑํ•ฉ๋‹ˆ๋‹ค. InCoder-32B๋Š” ๋‹จ์ˆœํžˆ ์š”๋ฆฌ๋ฒ•๋งŒ ์™ธ์šด ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ์ •๋น„ ๋งค๋‰ด์–ผ๊ณผ ๊ธฐ๊ณ„ ๋„๋ฉด(์‚ฐ์—…์šฉ ์ฝ”๋“œ)๊นŒ์ง€ ์ง‘์ค‘์ ์œผ๋กœ ํ•™์Šตํ•˜์—ฌ, ์ผ๋ฐ˜ ์š”๋ฆฌ๋„ ์‹ค์ˆ˜ ์—†์ด ํ•˜๋ฉด์„œ๋„ ๊ณ ์žฅ ๋‚œ ๊ธฐ๊ณ„๋ฅผ ์ˆ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” โ€˜ํŠน์ˆ˜ ๊ธฐ์ˆ  ๊ฒธ๋น„ ์š”๋ฆฌ์‚ฌโ€™๋ฅผ ํ›ˆ๋ จ์‹œํ‚จ ๊ฒƒ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

๋‹จ๊ณ„๋ณ„ ๋™์ž‘ ์›๋ฆฌ

์ด ๋ชจ๋ธ์€ ์ด 3๋‹จ๊ณ„์˜ ํ›ˆ๋ จ ๊ณผ์ •์„ ๊ฑฐ์ณ ์™„์„ฑ๋ฉ๋‹ˆ๋‹ค.

์ฒซ์งธ, ์‚ฌ์ „ ํ›ˆ๋ จ ๋‹จ๊ณ„์—์„œ๋Š” ์ผ๋ฐ˜์ ์ธ ์ฝ”๋“œ ๋ฐ์ดํ„ฐ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ์‚ฐ์—… ํ˜„์žฅ์˜ ์ฝ”๋“œ๋ฅผ ํญ๋„“๊ฒŒ ์ˆ˜์ง‘ํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ ํฅ๋ฏธ๋กœ์šด ์ ์€ ๊ธฐ์ˆ  ๋ฌธํ—Œ์ด๋‚˜ ๋…ผ๋ฌธ์— ์žˆ๋Š” ์ฝ”๋“œ ์กฐ๊ฐ์„ OCR(๊ด‘ํ•™ ๋ฌธ์ž ์ธ์‹) ๊ธฐ์ˆ ์„ ํ†ตํ•ด ๊ธ์–ด๋ชจ์•„ ํ•™์Šต ๋ฐ์ดํ„ฐ์— ํฌํ•จ์‹œ์ผฐ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋งˆ์น˜ ์š”๋ฆฌ ์ฑ…๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์ •๋น„์‚ฌ์˜ ๋น„๋ฐ€ ๋…ธํŠธ๊นŒ์ง€ ์Šค์บ”ํ•ด์„œ ๊ณต๋ถ€ํ•œ ์…ˆ์ž…๋‹ˆ๋‹ค.

๋‘˜์งธ, ์ค‘๊ฐ„ ํ›ˆ๋ จ ๋‹จ๊ณ„์—์„œ๋Š” ๋ชจ๋ธ์ด ํ•œ ๋ฒˆ์— ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ๋ฌธ๋งฅ์˜ ๊ธธ์ด(Context)๋ฅผ 8์ฒœ ํ† ํฐ์—์„œ 12๋งŒ 8์ฒœ ํ† ํฐ์œผ๋กœ ์ ์ง„์ ์œผ๋กœ ๋Š˜๋ฆฝ๋‹ˆ๋‹ค. ์ด๋Š” ๋ชจ๋ธ์˜ ๊ธฐ์–ต๋ ฅ์„ ๊ฐ•ํ™”ํ•˜์—ฌ ๊ธด ์ฝ”๋“œ๋‚˜ ๋ณต์žกํ•œ ํ•˜๋“œ์›จ์–ด ๋ช…์„ธ์„œ๋ฅผ ํ†ต์งธ๋กœ ์ฝ๊ณ  ์ดํ•ดํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋งŒ๋“ญ๋‹ˆ๋‹ค. ๋˜ํ•œ ๊ฐ€์ƒ์˜ ์‚ฐ์—…์šฉ ์ถ”๋ก  ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ด ๋…ผ๋ฆฌ์  ์‚ฌ๊ณ ๋ ฅ์„ ํ‚ค์›๋‹ˆ๋‹ค.

์…‹์งธ, ์‚ฌํ›„ ํ›ˆ๋ จ ๋‹จ๊ณ„์—์„œ๋Š” ๋ชจ๋ธ์ด ์ƒ์„ฑํ•œ ์ฝ”๋“œ๋ฅผ ์‹ค์ œ๋กœ ์‹คํ–‰ํ•ด ๋ณด๊ณ  ํ‹€๋ฆฌ๋ฉด ์ˆ˜์ •ํ•˜๋Š” ๊ณผ์ •์„ ๋ฐ˜๋ณตํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์‹œํ—˜ ๊ณต๋ถ€๋ฅผ ํ•  ๋•Œ ๋‹จ์ˆœํžˆ ๋‹ต๋งŒ ์™ธ์šฐ๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ์ง์ ‘ ๋ฌธ์ œ๋ฅผ ํ’€๊ณ  ์ฑ„์ ํ•ด ๋ณด๋ฉฐ ์˜ค๋‹ต์„ ๊ณ ์น˜๋Š” ํ•™์Šต๋ฒ•๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋ฐ ์•„ํ‚คํ…์ฒ˜

์ด ๋ชจ๋ธ์€ ๊ธฐ๋ณธ์ ์œผ๋กœ ๋””์ฝ”๋” ์ „์šฉ ํŠธ๋žœ์Šคํฌ๋จธ(Transformer) ๊ตฌ์กฐ๋ฅผ ์‚ฌ์šฉํ•˜๋ฉฐ, ์ž๊ธฐ ํšŒ๊ท€ ์–ธ์–ด ๋ชจ๋ธ๋ง๊ณผ FIM(Fill-in-the-Middle) ๋ฐฉ์‹์„ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค. FIM์€ ์ฝ”๋“œ์˜ ์ค‘๊ฐ„์— ๋นˆ์นธ์„ ๋‘๊ณ  ์–‘์ชฝ ๋ฌธ๋งฅ์„ ๋ณด์—ฌ์ค€ ๋’ค ๋ชจ๋ธ์ด ์ค‘๊ฐ„์„ ์ฑ„์šฐ๊ฒŒ ํ•˜๋Š” ํ•™์Šต ๋ฐฉ์‹์œผ๋กœ, ์ฝ”๋“œ ์™„์„ฑ ์ž‘์—…์— ํŠนํžˆ ํšจ๊ณผ์ ์ž…๋‹ˆ๋‹ค.

3. ์‹คํ—˜ ๊ฒฐ๊ณผ ๋ถ„์„

์–ด๋–ค ๋ฒค์น˜๋งˆํฌ์—์„œ ํ…Œ์ŠคํŠธํ–ˆ๋‚˜?

์—ฐ๊ตฌ์ง„์€ ์ผ๋ฐ˜์ ์ธ ์ฝ”๋“œ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด HumanEval, MBPP, BigCodeBench ๋“ฑ 14๊ฐœ์˜ ์ฃผ์š” ๋ฒค์น˜๋งˆํฌ๋ฅผ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ๋”์šฑ ์ค‘์š”ํ•œ ๊ฒƒ์€ ์‚ฐ์—… ํ˜„์žฅ์˜ ์„ฑ๋Šฅ์„ ์ธก์ •ํ•˜๊ธฐ ์œ„ํ•ด ์นฉ ์„ค๊ณ„, ์ž„๋ฒ ๋””๋“œ ์‹œ์Šคํ…œ, GPU ์ตœ์ ํ™”, ์ปดํŒŒ์ผ๋Ÿฌ ์ตœ์ ํ™” ๋“ฑ 4๊ฐœ์˜ ์ „๋ฌธ ๋„๋ฉ”์ธ์— ๊ฑธ์นœ 9๊ฐœ์˜ ์‚ฐ์—…์šฉ ๋ฒค์น˜๋งˆํฌ๋ฅผ ์ƒˆ๋กญ๊ฒŒ ๊ตฌ์„ฑํ•˜๊ฑฐ๋‚˜ ํ™œ์šฉํ–ˆ๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค.

๊ธฐ์กด ์ตœ๊ณ  ์„ฑ๋Šฅ ๋ชจ๋ธ ๋Œ€๋น„ ์–ผ๋งˆ๋‚˜ ์ข‹์•„์กŒ๋‚˜?

์ผ๋ฐ˜์ ์ธ ๋ฒค์น˜๋งˆํฌ์—์„œ๋Š” DeepSeek, Qwen, Claude ๊ฐ™์€ ์ตœ์‹  ๋ชจ๋ธ๋“ค๊ณผ ๋น„๋“ฑํ•˜๊ฑฐ๋‚˜ ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์‚ฐ์—…์šฉ ๋ฒค์น˜๋งˆํฌ์—์„œ๋Š” ๋‘๋“œ๋Ÿฌ์ง„ ์ฐจ์ด๋ฅผ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๊ธฐ์กด ์ตœ์ƒ์œ„ ๋ชจ๋ธ๋“ค์ด GPU ์—ฐ์‚ฐ์ž ์ƒ์„ฑ ์ž‘์—…์—์„œ 28.80%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์ธ ๋ฐ˜๋ฉด, InCoder-32B๋Š” ์‹คํ–‰ ๊ธฐ๋ฐ˜ ๊ฒ€์ฆ์„ ํ†ตํ•ด ์ด๋ฅผ ํฌ๊ฒŒ ๊ฐœ์„ ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ Verilog ์ฝ”๋“œ ์ƒ์„ฑ์—์„œ๋„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ†ต๊ณผ์œจ๊ณผ ํ˜•์‹์  ๋™๋“ฑ์„ฑ ๊ฒ€์‚ฌ ํ†ต๊ณผ์œจ ๋ฉด์—์„œ ๊ธฐ์กด ๋ชจ๋ธ๋“ค๋ณด๋‹ค ํ›จ์”ฌ ๋” ์•ˆ์ •์ ์ธ ๊ฒฐ๊ณผ๋ฅผ ๋„์ถœํ–ˆ์Šต๋‹ˆ๋‹ค.

์ฃผ๋ชฉํ•  ๋งŒํ•œ ์„ฑ๊ณผ

์ด ๋ชจ๋ธ์˜ ๊ฐ€์žฅ ํฐ ์„ฑ๊ณผ๋Š” ์‚ฐ์—…์šฉ ํŠนํ™” ๋Šฅ๋ ฅ์„ ํ‚ค์šฐ๊ธฐ ์œ„ํ•ด ์ผ๋ฐ˜ ์ฝ”๋”ฉ ๋Šฅ๋ ฅ์„ ํฌ์ƒํ•˜์ง€ ์•Š์•˜๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. ์ฆ‰, ์›น ๊ฐœ๋ฐœ ๋Šฅ๋ ฅ์„ ์œ ์ง€ํ•˜๋ฉด์„œ ํ•˜๋“œ์›จ์–ด ์„ค๊ณ„๋ผ๋Š” ์–ด๋ ค์šด ๊ณผ์ œ๊นŒ์ง€ ํ•ด๊ฒฐํ•˜๋Š” โ€˜๋ฉ€ํ‹ฐ ํ”Œ๋ ˆ์ด์–ดโ€™๋กœ์„œ์˜ ๊ฐ€๋Šฅ์„ฑ์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค.

4. ํ•œ๊ณ„์ ๊ณผ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

์ €์ž๊ฐ€ ์–ธ๊ธ‰ํ•œ ํ•œ๊ณ„

๋…ผ๋ฌธ์—์„œ๋Š” ์–ธ๊ธ‰๋˜์ง€ ์•Š์•˜์ง€๋งŒ, ์ผ๋ฐ˜์ ์œผ๋กœ ์‚ฐ์—…์šฉ ๋ฐ์ดํ„ฐ๋Š” ๊ธฐ์—… ๋น„๋ฐ€์ด๋‚˜ ์ €์ž‘๊ถŒ ๋ฌธ์ œ๋กœ ์ธํ•ด ๊ณต๊ฐœ๊ฐ€ ๋งค์šฐ ์ œํ•œ์ ์ž…๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ๊ณ ํ’ˆ์งˆ์˜ ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ํ™•๋ณดํ•˜๋Š” ๊ฒƒ ์ž์ฒด๊ฐ€ ํฐ ๋„์ „์ด๋ฉฐ, ๋ชจ๋ธ์ด ๋งค์šฐ ๋ณต์žกํ•œ ํ•˜๋“œ์›จ์–ด ์„ค๊ณ„ ๊ทœ์น™์„ ์™„๋ฒฝํ•˜๊ฒŒ ์ค€์ˆ˜ํ•˜๋Š”์ง€์— ๋Œ€ํ•œ ๊ฒ€์ฆ์€ ์—ฌ์ „ํžˆ ์–ด๋ ต์Šต๋‹ˆ๋‹ค.

๊ฐœ์„  ๊ฐ€๋Šฅํ•œ ์ 

ํ–ฅํ›„ ์—ฐ๊ตฌ์—์„œ๋Š” ๋” ๋‹ค์–‘ํ•œ ํ•˜๋“œ์›จ์–ด ์•„ํ‚คํ…์ฒ˜๋‚˜ ํฌ๊ท€ํ•œ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์–ธ์–ด๋กœ ๋ฐ์ดํ„ฐ ๋ฒ”์œ„๋ฅผ ํ™•์žฅํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ๋‹จ์ˆœํžˆ ์ฝ”๋“œ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๊ฒƒ์„ ๋„˜์–ด ์‹ค์ œ ์นฉ์œผ๋กœ ํ•ฉ์„ฑํ•˜๋Š” ๋‹จ๊ณ„๊นŒ์ง€ ์ž๋™ํ™”ํ•˜๋Š” ๊ณ ๊ธ‰ ๊ฒ€์ฆ ํŒŒ์ดํ”„๋ผ์ธ๊ณผ์˜ ํ†ตํ•ฉ์ด ํ•„์š”ํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค.

5. ์‹ค๋ฌด ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ

์–ด๋””์— ๋ฐ”๋กœ ์ ์šฉ ๊ฐ€๋Šฅํ• ๊นŒ?

์ด ๋ชจ๋ธ์€ ๋ฐ˜๋„์ฒด ์„ค๊ณ„ ์ž๋™ํ™”(EDA) ํˆด์˜ ๋ณด์กฐ ๋„๊ตฌ, ๊ณ ์„ฑ๋Šฅ GPU ์ปค๋„ ์ตœ์ ํ™”, ์ž„๋ฒ ๋””๋“œ ์‹œ์Šคํ…œ ํŽŒ์›จ์–ด ๊ฐœ๋ฐœ, ๊ทธ๋ฆฌ๊ณ  ์ปดํŒŒ์ผ๋Ÿฌ ์ตœ์ ํ™” ๊ธฐ์ˆ  ๊ฐœ๋ฐœ ๋“ฑ์— ์ฆ‰์‹œ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์—”์ง€๋‹ˆ์–ด๊ฐ€ Verilog๋กœ ํšŒ๋กœ๋ฅผ ์„ค๊ณ„ํ•  ๋•Œ ๋ชจ๋ธ์ด ์ฝ”๋“œ๋ฅผ ์ž๋™ ์™„์„ฑํ•˜๊ฑฐ๋‚˜ ๋ฒ„๊ทธ๋ฅผ ์ฐพ์•„์ฃผ๋Š” ์ฝ”ํŒŒ์ผ๋Ÿฟ(Copilot) ์—ญํ• ์„ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ํ•„์š”ํ•œ ๋ฆฌ์†Œ์Šค

320์–ต(32B) ๊ฐœ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ€์ง„ ๋ชจ๋ธ์ด๋ฏ€๋กœ, ์ถ”๋ก ์„ ์œ„ํ•ด ์ƒ๋‹นํ•œ ์–‘์˜ GPU ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ํšจ์œจ์ ์ธ ์ถ”๋ก ์„ ์œ„ํ•ด์„œ๋Š” A100์ด๋‚˜ H100 ๊ฐ™์€ ๊ณ ์„ฑ๋Šฅ GPU๊ฐ€ ์—ฌ๋Ÿฌ ๋Œ€ ํ•„์š”ํ•˜๋ฉฐ, ๋กœ์ปฌ ํ™˜๊ฒฝ๋ณด๋‹ค๋Š” ํด๋ผ์šฐ๋“œ ํ™˜๊ฒฝ์—์„œ ์„œ๋น„์Šค ํ˜•ํƒœ๋กœ ์šด์˜ํ•˜๋Š” ๊ฒƒ์ด ์ ํ•ฉํ•ด ๋ณด์ž…๋‹ˆ๋‹ค.

6. ์ด ๋…ผ๋ฌธ์„ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•œ ์‚ฌ์ „ ์ง€์‹

  • LLM (Large Language Model)
    • ๋ฐฉ๋Œ€ํ•œ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋กœ ์‚ฌ์ „ ํ›ˆ๋ จ๋˜์–ด ์ž์—ฐ์–ด ์ดํ•ด ๋ฐ ์ƒ์„ฑ์— ํŠนํ™”๋œ ๊ฑฐ๋Œ€ํ•œ ์ธ๊ณต์ง€๋Šฅ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.
  • ํŠธ๋žœ์Šคํฌ๋จธ (Transformer)
    • ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ๋ถ„์•ผ์—์„œ ๊ฐ€์žฅ ๋„๋ฆฌ ์‚ฌ์šฉ๋˜๋Š” ์‹ ๊ฒฝ๋ง ์•„ํ‚คํ…์ฒ˜๋กœ, ์–ดํ…์…˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ํ†ตํ•ด ๋ฌธ๋งฅ์„ ์ดํ•ดํ•ฉ๋‹ˆ๋‹ค.
  • ์‚ฌ์ „ ํ›ˆ๋ จ (Pre-training)
    • ๋ชจ๋ธ์„ ํŠน์ • ์ž‘์—…์— ๋งž๊ฒŒ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๊ธฐ ์ „์—, ๋Œ€๊ทœ๋ชจ์˜ ์ผ๋ฐ˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ด ๊ธฐ๋ณธ์ ์ธ ์–ธ์–ด ๋Šฅ๋ ฅ์„ ํ•™์Šต์‹œํ‚ค๋Š” ๋‹จ๊ณ„์ž…๋‹ˆ๋‹ค.
  • FIM (Fill-in-the-Middle)
    • ์ฝ”๋“œ์˜ ์•ž๋ถ€๋ถ„๊ณผ ๋’ท๋ถ€๋ถ„์„ ์ฃผ๊ณ  ์ค‘๊ฐ„์— ๋น„์–ด์žˆ๋Š” ์ฝ”๋“œ๋ฅผ ์ถ”๋ก ํ•˜๊ฒŒ ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ, ์ฝ”๋“œ ํŽธ์ง‘ ๋ณด์กฐ์— ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค.
  • Verilog
    • ํ•˜๋“œ์›จ์–ด ๊ธฐ์ˆ  ์–ธ์–ด(HDL)์˜ ์ผ์ข…์œผ๋กœ, ๋ฐ˜๋„์ฒด๋‚˜ ๋””์ง€ํ„ธ ํšŒ๋กœ๋ฅผ ์„ค๊ณ„ํ•˜๊ณ  ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•  ๋•Œ ์‚ฌ์šฉํ•˜๋Š” ์ „๋ฌธ ์–ธ์–ด์ž…๋‹ˆ๋‹ค.
  • CUDA (Compute Unified Device Architecture)
    • ์—”๋น„๋””์•„(NVIDIA)๊ฐ€ ๊ฐœ๋ฐœํ•œ ๋ณ‘๋ ฌ ์ปดํ“จํŒ… ํ”Œ๋žซํผ ๋ฐ API ๋ชจ๋ธ๋กœ, GPU๋ฅผ ์‚ฌ์šฉํ•œ ์—ฐ์‚ฐ์„ ํ”„๋กœ๊ทธ๋ž˜๋ฐํ•  ๋•Œ ์”๋‹ˆ๋‹ค.
  • ์ถ”๋ก  (Inference)
    • ํ•™์Šต์ด ์™„๋ฃŒ๋œ ๋ชจ๋ธ์ด ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋ฅผ ์ž…๋ ฅ๋ฐ›์•„ ๊ฒฐ๊ณผ๋ฅผ ์˜ˆ์ธกํ•˜๊ฑฐ๋‚˜ ์ƒ์„ฑํ•˜๋Š” ๊ณผ์ •์„ ๋งํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ“š ์ด๋ฒˆ ์ฃผ ๊ด€๋ จ Deep Dive

์ˆœ์œ„๋…ผ๋ฌธDeep Dive
๐Ÿฅ‡Demystifing Video ReasoningDD-046
๐ŸฅˆInCoder-32B: Code Foundation Model โ€ฆ๐Ÿ“ ํ˜„์žฌ ๋ฌธ์„œ
๐Ÿฅ‰AI Can Learn Scientific TasteDD-048
4.SocialOmni: Benchmarking Audio-Visuโ€ฆDD-049
5.MiroThinker-1.7 & H1: Towards Heavyโ€ฆDD-050

๐Ÿ“… ์ƒ์„ฑ์ผ: 2026-03-22 | ๐Ÿค– GLM-4.7 Deep Dive