โ ๐ ์ด๋ฒ ์ฃผ Weekly Digest๋ก ๋์๊ฐ๊ธฐ
DD-047 InCoder-32B: Code Foundation Model for Industrial Scenarios
arXiv: 2603.16790 ๊ธฐ๊ด: Beihang University Upvotes: 290 | Comments: 4 ์์: ์ด๋ฒ ์ฃผ Top 2
์๋ ํ์ธ์. AI/ML ์ ๋ฌธ๊ฐ๋ก์ ์ด ํฅ๋ฏธ๋ก์ด ๋ ผ๋ฌธ์ ๊น์ด ์๊ฒ ๋ถ์ํด ๋๋ฆฌ๊ฒ ์ต๋๋ค. ์ฃผ๋์ด ๊ฐ๋ฐ์๋ถ๋ค๋ ์ฝ๊ฒ ์ดํดํ์ค ์ ์๋๋ก ํ์ค์ ์ธ ๋น์ ๋ฅผ ๋ค์ด ์ค๋ช ํ๊ฒ ์ต๋๋ค.
1. ์ ์ด ๋ ผ๋ฌธ์ด ์ค์ํ๊ฐ?
๊ธฐ์กด์ ๊ฑฐ๋ ์ธ์ด ๋ชจ๋ธ๋ค์ ์ผ๋ฐ์ ์ธ ์ํํธ์จ์ด ๊ฐ๋ฐ(์น ์๋น์ค, ์ฑ ๋ง๋ค๊ธฐ ๋ฑ)์์๋ ๋ฐ์ด๋ ์ฑ๊ณผ๋ฅผ ๋ณด์์ง๋ง, ์นฉ ์ค๊ณ๋ GPU ์ปค๋ ์ต์ ํ์ ๊ฐ์ ๋ณต์กํ ์ฐ์ ํ์ฅ์์๋ ํ๋์จ์ด์ ๋ฌผ๋ฆฌ์ ์ ์ฝ๊ณผ ์ ๋ฌธ์ ์ธ ์ธ์ด๋ฅผ ์ดํดํ์ง ๋ชปํด ์ฑ๋ฅ์ด ๊ธ๊ฒฉํ ๋จ์ด์ง๋ ํ๊ณ๊ฐ ์์์ต๋๋ค. ์ด ๋ ผ๋ฌธ์ ์ผ๋ฐ์ ์ธ ์ฝ๋ฉ ๋ฅ๋ ฅ์ ์ ์งํ๋ฉด์๋, ํ๋์จ์ด ์๋ฏธ๋ก ๊ณผ ์์ ์ ์ฝ์ ์ถ๋ก ํ ์ ์๋ ์ต์ด์ 320์ต ํ๋ผ๋ฏธํฐ ๊ท๋ชจ ์ฐ์ ์ฉ ์ฝ๋ ๋ชจ๋ธ์ธ InCoder-32B๋ฅผ ์ ์ํ์ฌ ์ด ๊ฒฉ์ฐจ๋ฅผ ํด๊ฒฐํ์ต๋๋ค.
2. ํต์ฌ ์์ด๋์ด ์ฝ๊ฒ ์ดํดํ๊ธฐ
์ผ์์ํ ๋น์ : โ๋ง๋ฅ ์๋ฆฌ์ฌโ vs โํน์ ์ฅ๋น ์ ๋น์ฌโ
๊ธฐ์กด์ ์ฝ๋ ๋ชจ๋ธ์ ๋ง์น ์ธ๊ณ ๊ฐ๊ตญ์ ์๋ฆฌ๋ฅผ ์ํ๋ โ๋ง๋ฅ ์๋ฆฌ์ฌโ์ ๊ฐ์ต๋๋ค. ํ์คํ๋ ํ์ด์ฌ ์คํฌ๋ฆฝํธ๋ฅผ ๋ง๋๋ ๋ฐ๋ ๋ฅ์ํ์ง๋ง, ์ ๋น์์์ ์์ง์ ๋ฏ์ด ๊ณ ์น๊ฑฐ๋ ๋ฐ๋์ฒด ๊ณต์ฅ ๋ผ์ธ์ ์ ์ดํ๋ ๋ฐ ํ์ํ ์ ๋ฌธ ์ง์์ ๋ถ์กฑํฉ๋๋ค. InCoder-32B๋ ๋จ์ํ ์๋ฆฌ๋ฒ๋ง ์ธ์ด ๊ฒ์ด ์๋๋ผ, ์ ๋น ๋งค๋ด์ผ๊ณผ ๊ธฐ๊ณ ๋๋ฉด(์ฐ์ ์ฉ ์ฝ๋)๊น์ง ์ง์ค์ ์ผ๋ก ํ์ตํ์ฌ, ์ผ๋ฐ ์๋ฆฌ๋ ์ค์ ์์ด ํ๋ฉด์๋ ๊ณ ์ฅ ๋ ๊ธฐ๊ณ๋ฅผ ์๋ฆฌํ ์ ์๋ โํน์ ๊ธฐ์ ๊ฒธ๋น ์๋ฆฌ์ฌโ๋ฅผ ํ๋ จ์ํจ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค.
๋จ๊ณ๋ณ ๋์ ์๋ฆฌ
์ด ๋ชจ๋ธ์ ์ด 3๋จ๊ณ์ ํ๋ จ ๊ณผ์ ์ ๊ฑฐ์ณ ์์ฑ๋ฉ๋๋ค.
์ฒซ์งธ, ์ฌ์ ํ๋ จ ๋จ๊ณ์์๋ ์ผ๋ฐ์ ์ธ ์ฝ๋ ๋ฐ์ดํฐ๋ฟ๋ง ์๋๋ผ, ์ฐ์ ํ์ฅ์ ์ฝ๋๋ฅผ ํญ๋๊ฒ ์์งํฉ๋๋ค. ํนํ ํฅ๋ฏธ๋ก์ด ์ ์ ๊ธฐ์ ๋ฌธํ์ด๋ ๋ ผ๋ฌธ์ ์๋ ์ฝ๋ ์กฐ๊ฐ์ OCR(๊ดํ ๋ฌธ์ ์ธ์) ๊ธฐ์ ์ ํตํด ๊ธ์ด๋ชจ์ ํ์ต ๋ฐ์ดํฐ์ ํฌํจ์์ผฐ๋ค๋ ๊ฒ์ ๋๋ค. ๋ง์น ์๋ฆฌ ์ฑ ๋ฟ๋ง ์๋๋ผ ์ ๋น์ฌ์ ๋น๋ฐ ๋ ธํธ๊น์ง ์ค์บํด์ ๊ณต๋ถํ ์ ์ ๋๋ค.
๋์งธ, ์ค๊ฐ ํ๋ จ ๋จ๊ณ์์๋ ๋ชจ๋ธ์ด ํ ๋ฒ์ ์ฒ๋ฆฌํ ์ ์๋ ๋ฌธ๋งฅ์ ๊ธธ์ด(Context)๋ฅผ 8์ฒ ํ ํฐ์์ 12๋ง 8์ฒ ํ ํฐ์ผ๋ก ์ ์ง์ ์ผ๋ก ๋๋ฆฝ๋๋ค. ์ด๋ ๋ชจ๋ธ์ ๊ธฐ์ต๋ ฅ์ ๊ฐํํ์ฌ ๊ธด ์ฝ๋๋ ๋ณต์กํ ํ๋์จ์ด ๋ช ์ธ์๋ฅผ ํต์งธ๋ก ์ฝ๊ณ ์ดํดํ ์ ์๊ฒ ๋ง๋ญ๋๋ค. ๋ํ ๊ฐ์์ ์ฐ์ ์ฉ ์ถ๋ก ๋ฐ์ดํฐ๋ฅผ ํตํด ๋ ผ๋ฆฌ์ ์ฌ๊ณ ๋ ฅ์ ํค์๋๋ค.
์ ์งธ, ์ฌํ ํ๋ จ ๋จ๊ณ์์๋ ๋ชจ๋ธ์ด ์์ฑํ ์ฝ๋๋ฅผ ์ค์ ๋ก ์คํํด ๋ณด๊ณ ํ๋ฆฌ๋ฉด ์์ ํ๋ ๊ณผ์ ์ ๋ฐ๋ณตํฉ๋๋ค. ์ด๋ ์ํ ๊ณต๋ถ๋ฅผ ํ ๋ ๋จ์ํ ๋ต๋ง ์ธ์ฐ๋ ๊ฒ์ด ์๋๋ผ, ์ง์ ๋ฌธ์ ๋ฅผ ํ๊ณ ์ฑ์ ํด ๋ณด๋ฉฐ ์ค๋ต์ ๊ณ ์น๋ ํ์ต๋ฒ๊ณผ ๊ฐ์ต๋๋ค.
ํต์ฌ ์๊ณ ๋ฆฌ์ฆ ๋ฐ ์ํคํ ์ฒ
์ด ๋ชจ๋ธ์ ๊ธฐ๋ณธ์ ์ผ๋ก ๋์ฝ๋ ์ ์ฉ ํธ๋์คํฌ๋จธ(Transformer) ๊ตฌ์กฐ๋ฅผ ์ฌ์ฉํ๋ฉฐ, ์๊ธฐ ํ๊ท ์ธ์ด ๋ชจ๋ธ๋ง๊ณผ FIM(Fill-in-the-Middle) ๋ฐฉ์์ ํ์ฉํฉ๋๋ค. FIM์ ์ฝ๋์ ์ค๊ฐ์ ๋น์นธ์ ๋๊ณ ์์ชฝ ๋ฌธ๋งฅ์ ๋ณด์ฌ์ค ๋ค ๋ชจ๋ธ์ด ์ค๊ฐ์ ์ฑ์ฐ๊ฒ ํ๋ ํ์ต ๋ฐฉ์์ผ๋ก, ์ฝ๋ ์์ฑ ์์ ์ ํนํ ํจ๊ณผ์ ์ ๋๋ค.
3. ์คํ ๊ฒฐ๊ณผ ๋ถ์
์ด๋ค ๋ฒค์น๋งํฌ์์ ํ ์คํธํ๋?
์ฐ๊ตฌ์ง์ ์ผ๋ฐ์ ์ธ ์ฝ๋ ์ฑ๋ฅ์ ํ๊ฐํ๊ธฐ ์ํด HumanEval, MBPP, BigCodeBench ๋ฑ 14๊ฐ์ ์ฃผ์ ๋ฒค์น๋งํฌ๋ฅผ ์ฌ์ฉํ์ต๋๋ค. ๋์ฑ ์ค์ํ ๊ฒ์ ์ฐ์ ํ์ฅ์ ์ฑ๋ฅ์ ์ธก์ ํ๊ธฐ ์ํด ์นฉ ์ค๊ณ, ์๋ฒ ๋๋ ์์คํ , GPU ์ต์ ํ, ์ปดํ์ผ๋ฌ ์ต์ ํ ๋ฑ 4๊ฐ์ ์ ๋ฌธ ๋๋ฉ์ธ์ ๊ฑธ์น 9๊ฐ์ ์ฐ์ ์ฉ ๋ฒค์น๋งํฌ๋ฅผ ์๋กญ๊ฒ ๊ตฌ์ฑํ๊ฑฐ๋ ํ์ฉํ๋ค๋ ์ ์ ๋๋ค.
๊ธฐ์กด ์ต๊ณ ์ฑ๋ฅ ๋ชจ๋ธ ๋๋น ์ผ๋ง๋ ์ข์์ก๋?
์ผ๋ฐ์ ์ธ ๋ฒค์น๋งํฌ์์๋ DeepSeek, Qwen, Claude ๊ฐ์ ์ต์ ๋ชจ๋ธ๋ค๊ณผ ๋น๋ฑํ๊ฑฐ๋ ๊ฒฝ์๋ ฅ ์๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ์์ต๋๋ค. ํ์ง๋ง ์ฐ์ ์ฉ ๋ฒค์น๋งํฌ์์๋ ๋๋๋ฌ์ง ์ฐจ์ด๋ฅผ ๋ณด์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ๊ธฐ์กด ์ต์์ ๋ชจ๋ธ๋ค์ด GPU ์ฐ์ฐ์ ์์ฑ ์์ ์์ 28.80%์ ์ฑ๊ณต๋ฅ ์ ๋ณด์ธ ๋ฐ๋ฉด, InCoder-32B๋ ์คํ ๊ธฐ๋ฐ ๊ฒ์ฆ์ ํตํด ์ด๋ฅผ ํฌ๊ฒ ๊ฐ์ ํ์ต๋๋ค. ๋ํ Verilog ์ฝ๋ ์์ฑ์์๋ ์๋ฎฌ๋ ์ด์ ํต๊ณผ์จ๊ณผ ํ์์ ๋๋ฑ์ฑ ๊ฒ์ฌ ํต๊ณผ์จ ๋ฉด์์ ๊ธฐ์กด ๋ชจ๋ธ๋ค๋ณด๋ค ํจ์ฌ ๋ ์์ ์ ์ธ ๊ฒฐ๊ณผ๋ฅผ ๋์ถํ์ต๋๋ค.
์ฃผ๋ชฉํ ๋งํ ์ฑ๊ณผ
์ด ๋ชจ๋ธ์ ๊ฐ์ฅ ํฐ ์ฑ๊ณผ๋ ์ฐ์ ์ฉ ํนํ ๋ฅ๋ ฅ์ ํค์ฐ๊ธฐ ์ํด ์ผ๋ฐ ์ฝ๋ฉ ๋ฅ๋ ฅ์ ํฌ์ํ์ง ์์๋ค๋ ์ ์ ๋๋ค. ์ฆ, ์น ๊ฐ๋ฐ ๋ฅ๋ ฅ์ ์ ์งํ๋ฉด์ ํ๋์จ์ด ์ค๊ณ๋ผ๋ ์ด๋ ค์ด ๊ณผ์ ๊น์ง ํด๊ฒฐํ๋ โ๋ฉํฐ ํ๋ ์ด์ดโ๋ก์์ ๊ฐ๋ฅ์ฑ์ ์ ์ฆํ์ต๋๋ค.
4. ํ๊ณ์ ๊ณผ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ
์ ์๊ฐ ์ธ๊ธํ ํ๊ณ
๋ ผ๋ฌธ์์๋ ์ธ๊ธ๋์ง ์์์ง๋ง, ์ผ๋ฐ์ ์ผ๋ก ์ฐ์ ์ฉ ๋ฐ์ดํฐ๋ ๊ธฐ์ ๋น๋ฐ์ด๋ ์ ์๊ถ ๋ฌธ์ ๋ก ์ธํด ๊ณต๊ฐ๊ฐ ๋งค์ฐ ์ ํ์ ์ ๋๋ค. ๋ฐ๋ผ์ ๊ณ ํ์ง์ ํ์ต ๋ฐ์ดํฐ๋ฅผ ํ๋ณดํ๋ ๊ฒ ์์ฒด๊ฐ ํฐ ๋์ ์ด๋ฉฐ, ๋ชจ๋ธ์ด ๋งค์ฐ ๋ณต์กํ ํ๋์จ์ด ์ค๊ณ ๊ท์น์ ์๋ฒฝํ๊ฒ ์ค์ํ๋์ง์ ๋ํ ๊ฒ์ฆ์ ์ฌ์ ํ ์ด๋ ต์ต๋๋ค.
๊ฐ์ ๊ฐ๋ฅํ ์
ํฅํ ์ฐ๊ตฌ์์๋ ๋ ๋ค์ํ ํ๋์จ์ด ์ํคํ ์ฒ๋ ํฌ๊ทํ ํ๋ก๊ทธ๋๋ฐ ์ธ์ด๋ก ๋ฐ์ดํฐ ๋ฒ์๋ฅผ ํ์ฅํ ์ ์์ต๋๋ค. ๋ํ, ๋จ์ํ ์ฝ๋๋ฅผ ์์ฑํ๋ ๊ฒ์ ๋์ด ์ค์ ์นฉ์ผ๋ก ํฉ์ฑํ๋ ๋จ๊ณ๊น์ง ์๋ํํ๋ ๊ณ ๊ธ ๊ฒ์ฆ ํ์ดํ๋ผ์ธ๊ณผ์ ํตํฉ์ด ํ์ํ ๊ฒ์ ๋๋ค.
5. ์ค๋ฌด ์ ์ฉ ๊ฐ๋ฅ์ฑ
์ด๋์ ๋ฐ๋ก ์ ์ฉ ๊ฐ๋ฅํ ๊น?
์ด ๋ชจ๋ธ์ ๋ฐ๋์ฒด ์ค๊ณ ์๋ํ(EDA) ํด์ ๋ณด์กฐ ๋๊ตฌ, ๊ณ ์ฑ๋ฅ GPU ์ปค๋ ์ต์ ํ, ์๋ฒ ๋๋ ์์คํ ํ์จ์ด ๊ฐ๋ฐ, ๊ทธ๋ฆฌ๊ณ ์ปดํ์ผ๋ฌ ์ต์ ํ ๊ธฐ์ ๊ฐ๋ฐ ๋ฑ์ ์ฆ์ ํ์ฉ๋ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ์์ง๋์ด๊ฐ Verilog๋ก ํ๋ก๋ฅผ ์ค๊ณํ ๋ ๋ชจ๋ธ์ด ์ฝ๋๋ฅผ ์๋ ์์ฑํ๊ฑฐ๋ ๋ฒ๊ทธ๋ฅผ ์ฐพ์์ฃผ๋ ์ฝํ์ผ๋ฟ(Copilot) ์ญํ ์ ํ ์ ์์ต๋๋ค.
ํ์ํ ๋ฆฌ์์ค
320์ต(32B) ๊ฐ์ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง ๋ชจ๋ธ์ด๋ฏ๋ก, ์ถ๋ก ์ ์ํด ์๋นํ ์์ GPU ๋ฉ๋ชจ๋ฆฌ๊ฐ ํ์ํฉ๋๋ค. ํจ์จ์ ์ธ ์ถ๋ก ์ ์ํด์๋ A100์ด๋ H100 ๊ฐ์ ๊ณ ์ฑ๋ฅ GPU๊ฐ ์ฌ๋ฌ ๋ ํ์ํ๋ฉฐ, ๋ก์ปฌ ํ๊ฒฝ๋ณด๋ค๋ ํด๋ผ์ฐ๋ ํ๊ฒฝ์์ ์๋น์ค ํํ๋ก ์ด์ํ๋ ๊ฒ์ด ์ ํฉํด ๋ณด์ ๋๋ค.
6. ์ด ๋ ผ๋ฌธ์ ์ดํดํ๊ธฐ ์ํ ์ฌ์ ์ง์
- LLM (Large Language Model)
- ๋ฐฉ๋ํ ํ ์คํธ ๋ฐ์ดํฐ๋ก ์ฌ์ ํ๋ จ๋์ด ์์ฐ์ด ์ดํด ๋ฐ ์์ฑ์ ํนํ๋ ๊ฑฐ๋ํ ์ธ๊ณต์ง๋ฅ ๋ชจ๋ธ์ ๋๋ค.
- ํธ๋์คํฌ๋จธ (Transformer)
- ์์ฐ์ด ์ฒ๋ฆฌ ๋ถ์ผ์์ ๊ฐ์ฅ ๋๋ฆฌ ์ฌ์ฉ๋๋ ์ ๊ฒฝ๋ง ์ํคํ ์ฒ๋ก, ์ดํ ์ ๋ฉ์ปค๋์ฆ์ ํตํด ๋ฌธ๋งฅ์ ์ดํดํฉ๋๋ค.
- ์ฌ์ ํ๋ จ (Pre-training)
- ๋ชจ๋ธ์ ํน์ ์์ ์ ๋ง๊ฒ ๋ฏธ์ธ ์กฐ์ ํ๊ธฐ ์ ์, ๋๊ท๋ชจ์ ์ผ๋ฐ ๋ฐ์ดํฐ๋ฅผ ํตํด ๊ธฐ๋ณธ์ ์ธ ์ธ์ด ๋ฅ๋ ฅ์ ํ์ต์ํค๋ ๋จ๊ณ์ ๋๋ค.
- FIM (Fill-in-the-Middle)
- ์ฝ๋์ ์๋ถ๋ถ๊ณผ ๋ท๋ถ๋ถ์ ์ฃผ๊ณ ์ค๊ฐ์ ๋น์ด์๋ ์ฝ๋๋ฅผ ์ถ๋ก ํ๊ฒ ํ๋ ๋ฐฉ์์ผ๋ก, ์ฝ๋ ํธ์ง ๋ณด์กฐ์ ์ ์ฉํฉ๋๋ค.
- Verilog
- ํ๋์จ์ด ๊ธฐ์ ์ธ์ด(HDL)์ ์ผ์ข ์ผ๋ก, ๋ฐ๋์ฒด๋ ๋์งํธ ํ๋ก๋ฅผ ์ค๊ณํ๊ณ ์๋ฎฌ๋ ์ด์ ํ ๋ ์ฌ์ฉํ๋ ์ ๋ฌธ ์ธ์ด์ ๋๋ค.
- CUDA (Compute Unified Device Architecture)
- ์๋น๋์(NVIDIA)๊ฐ ๊ฐ๋ฐํ ๋ณ๋ ฌ ์ปดํจํ ํ๋ซํผ ๋ฐ API ๋ชจ๋ธ๋ก, GPU๋ฅผ ์ฌ์ฉํ ์ฐ์ฐ์ ํ๋ก๊ทธ๋๋ฐํ ๋ ์๋๋ค.
- ์ถ๋ก (Inference)
- ํ์ต์ด ์๋ฃ๋ ๋ชจ๋ธ์ด ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ์ ๋ ฅ๋ฐ์ ๊ฒฐ๊ณผ๋ฅผ ์์ธกํ๊ฑฐ๋ ์์ฑํ๋ ๊ณผ์ ์ ๋งํฉ๋๋ค.
๐ ์ด๋ฒ ์ฃผ ๊ด๋ จ Deep Dive
| ์์ | ๋ ผ๋ฌธ | Deep Dive |
|---|---|---|
| ๐ฅ | Demystifing Video Reasoning | DD-046 |
| ๐ฅ | InCoder-32B: Code Foundation Model โฆ | ๐ ํ์ฌ ๋ฌธ์ |
| ๐ฅ | AI Can Learn Scientific Taste | DD-048 |
| 4. | SocialOmni: Benchmarking Audio-Visuโฆ | DD-049 |
| 5. | MiroThinker-1.7 & H1: Towards Heavyโฆ | DD-050 |
๐ ์์ฑ์ผ: 2026-03-22 | ๐ค GLM-4.7 Deep Dive