ํ•œ๊ตญ IBM์˜ ์œ ๋ถ€์„  ์ƒ๋ฌด๋ฅผ ๋งŒ๋‚˜ Machine Learning/Deep Learning์˜ ์—ฐ์‚ฐ ํ”Œ๋žซํผ์œผ๋กœ ์ƒˆ๋กœ์ด ๊ด€์‹ฌ์ด ์ง‘์ค‘๋˜๊ณ  ์žˆ๋Š” GPU ์ปดํ“จํŒ…๊ณผ ์ธ๊ณต์ง€๋Šฅ์˜ ํ˜„์žฌ์™€ ๋ฏธ๋ž˜์— ๋Œ€ํ•˜์—ฌ ์ „๋ฐ˜์ ์ธ ์ด์•ผ๊ธฐ๋ฅผ ๋‚˜๋ˆ„์—ˆ๋‹ค. ๊ทธ ์ค‘์— GPU ์ปดํ“จํŒ…์„ ๋ฐ”ํƒ•์œผ๋กœ co-processor ๊ทธ๋ฆฌ๊ณ  ์‹œ์žฅ์— ์ƒˆ๋กœ์ด ์†Œ๊ฐœ๋œ ๊ธฐ์ˆ ๊ณผ ์ด๋ฅผ ๊ธฐ๋ฐ˜ํ•˜๋Š” ์‹œ์žฅ์˜ ์ „๋ง๊นŒ์ง€์˜ ์ธํ„ฐ๋ทฐ๋ฅผ ์ •๋ฆฌํ•˜์—ฌ ์—ฌ๊ธฐ์— ์‹ฃ๋Š”๋‹ค. ๋Œ€ํ™” ์ค‘์— ๋“ฑ์žฅํ•œ ์ „๋ฌธ์šฉ์–ด๋Š” ์ดํ•ด๋ฅผ ๋•๊ธฐ ์œ„ํ•ด ์„ค๋ช…์„ ๊ฒฏ๋œจ๋ ธ๋‹ค.

์œ ๋ถ€์„  ์ƒ๋ฌด๋Š” 1996๋…„ ํ•œ๊ตญIBM์— ์ž…์‚ฌํ–ˆ๋‹ค. ์ดํ›„ ํ˜„์žฌ๊นŒ์ง€ ๊ธฐ์ˆ ์˜์—… ์ตœ์ผ์„ ์—์„œ ์ผํ•˜๊ณ  ์žˆ์œผ๋ฉฐ, IBM Power Systems๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ UNIX, Linux ๊ทธ๋ฆฌ๊ณ  Big Data ๋ฐ GPU ์ปดํ“จํŒ…์„ ์ง€์›ํ•˜๊ณ  ์žˆ๋‹ค. ํ•œ๊ตญIBM์—์„œ ์ตœ๊ณ  ์—”์ง€๋‹ˆ์–ด๋กœ ํ‰๊ฐ€๋ฐ›๊ณ  ์žˆ์œผ๋ฉฐ, ๋‘ํ„ฐ์šด ๊ณ ๊ฐ์˜ ์‹ ๋ขฐ๋Š” ๊ทธ ์ฆ๊ฑฐ์ด๋‹ค.

X X X X X

– GPU computing์ด๋ž€ ๋ฌด์—‡์ธ๊ฐ€์š”?

> GPU๋ฅผ ์ด์šฉํ•œ ์ปดํ“จํŒ…์„ ๋งํ•ฉ๋‹ˆ๋‹ค. ์—ฌ๋Ÿฌ๊ฐ€์ง€ ๋ณ‘๋ ฌ๋‹จ์ˆœ๊ณ„์‚ฐ ์ž‘์—…์„ GPU๋ฅผ ์ด์šฉํ•ด์„œ ๊ฐ€์†ํ™”ํ•˜๋Š” ์ปดํ“จํŒ…, ๋Œ€ํ‘œ์ ์ธ ๊ฒƒ์œผ๋กœ๋Š” ๊ณผ๊ธฐ์—ฐ์‚ฐ์šฉ HPC ์—…๋ฌด ๋ฐ ๊ธˆ์œต ๊ด€๋ จ ์œ„ํ—˜ ๊ด€๋ฆฌ ์—…๋ฌด ๋“ฑ์—์„œ์˜ ๋Œ€๊ทœ๋ชจ ๊ณ„์‚ฐ ๋“ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ตœ๊ทผ์—๋Š” Machine Learning/Deep Learning (๊ธฐ๊ณ„ํ•™์Šต(ๆฉŸๆขฐๅญธ็ฟ’)/์‹ฌ์ธตํ•™์Šต(ๆทฑๅฑคๅญธ็ฟ’), ์ดํ•˜ ML/DL) ์ชฝ์ด ๊ฐ๊ด‘๋ฐ›๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๋ณธ ๋Œ€ํ™”์—์„œ ์–ธ๊ธ‰๋˜๋Š” GPU๋Š” GPGPU(General Purpose Graphic Processing Unit)๋ฅผ ๋งํ•œ๋‹ค. ์˜์ƒ ์ถœ๋ ฅ์„ ๋‹ด๋ณดํ•˜์ง€ ์•Š๋Š” ์ผ๋ฐ˜์—ฐ์‚ฐ์šฉ GPU์ด๋‹ค. ์ด์— ๋Œ€ํ•œ ์ผ๋ฐ˜์ ์ธ ์„ค๋ช…์€ ์ด์ „ ๊ธ€์„ ์ฐธ์กฐํ•˜๋ฉด ์ข‹๊ฒ ๋‹ค.

– GPU ์ปดํ“จํŒ…์„ ๋งํ•  ๋•Œ ‘๋ณ‘๋ ฌ’๊ณผ ‘๊ฐ€์†’์ด๋ผ๋Š” ํ‘œํ˜„์ด ํ•ญ์ƒ ํ•จ๊ป˜ ๋“ฑ์žฅํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด, GPU ์ปดํ“จํŒ…์—์„œ ์ด ๋‘๊ฐ€์ง€์— ๋Œ€ํ•˜์—ฌ ํŠน๋ณ„ํ•œ ๋Šฅ๋ ฅ์„ ๋ฐœํœ˜ํ•œ๋‹ค๋Š” ๋œป์œผ๋กœ ํ•ด์„๋„ ๊ฐ€๋Šฅํ•˜๋‹ค๊ณ  ๋ณด๋Š”๋ฐ์š”, ์ด๋Ÿฐ ‘๋ณ‘๋ ฌ’๊ณผ ‘๊ฐ€์†’์„ ๋ชฉ์ ์œผ๋กœ ํ•˜๋Š” ์—ฐ์‚ฐ์—์„œ ๋ฐ˜๋“œ์‹œ GPU๋ฅผ ์‚ฌ์šฉํ•ด์•ผ ํ•  ์ด์œ ๊ฐ€ ์žˆ๋‚˜์š”? ํ˜น์€ ๋‹ค๋ฅธ ์œ ์šฉํ•œ ๋ฐฉ์‹ ๋˜ํ•œ ์กด์žฌํ•˜๋‚˜์š”?

> ์ผ๋‹จ GPU๊ฐ€ ํ•˜๋Š” ์ผ์„ ๋ชจ์กฐ๋ฆฌ CPU๊ฐ€ ํ•ด๋„ ๋˜๊ณ , ์–ด๋–ค ๊ฒฝ์šฐ์—๋Š” CPU๊ฐ€ ํ•  ๋•Œ ๋” ๋น ๋ฅธ ๊ฒฝ์šฐ๋„ ๊ฝค ๋งŽ์Šต๋‹ˆ๋‹ค. ๋‹จ์ง€ ๊ณ„์‚ฐ์ด ๋‹จ์ˆœํ•œ๋ฐ, ๊ต‰์žฅํžˆ ๋งŽ์ด ๋ณ‘๋ ฌํ™” ํ•  ์ˆ˜ ์žˆ๋‹ค๋ฉด, GPU๋ฅผ ํ™œ์šฉํ•˜๋Š” ๊ฒƒ์ด ๋” ๋น ๋ฅด๊ณ  ๋” ์ €๋ ดํ•˜๊ฒŒ ํ•  ์ˆ˜ ์žˆ๊ฒ ์Šต๋‹ˆ๋‹ค. ํ•˜์—ฌ GPU๊ฐ€ ์ฃผ๋ชฉ๋ฐ›๊ฒŒ ๋œ ์ด์œ ์ด๊ณ , ๋ณ‘๋ ฌํ™” ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ด ๋งŽ์ง€ ์•Š๋‹ค๋ฉด CPU๋กœ ์—ฐ์‚ฐํ•˜๋Š” ๊ฒƒ์ด ๋” ์ข‹์€ ๊ฒฐ๊ณผ๋ฅผ ๊ฐ€์ ธ์˜ฌ ๋•Œ๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

– ๊ทธ๋Ÿผ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  GPU๋ฅผ ๋งŽ์ด ์–ธ๊ธ‰ํ•˜๋Š” ๊ฒƒ์€ ์•„๋ฌด๋ž˜๋„ ํšจ์œจ์ด ๋” ์ข‹์•„์„œ ๊ทธ๋Ÿฐ ๊ฒƒ์ธ๊ฐ€์š”?

> ๊ฒฐ๊ตญ ํšจ์œจ์˜ ๋ฌธ์ œ์ด๊ณ , ๋” ๋น ๋ฅด๊ฒŒ ๋” ์ ์€ ๋น„์šฉ์œผ๋กœ ํ•  ์ˆ˜ ์žˆ๋‹ค๋ฉด ์–ด๋–ค ๋ฐฉ์‹์˜ ํ•˜๋“œ์›จ์–ด๋ฅผ ์„ ํƒํ•˜๋“  ๋ฌธ์ œ๋Š” ์—†์Šต๋‹ˆ๋‹ค.

– ์ผ๋ฐ˜์ ์œผ๋กœ GPU์˜ ์ŠคํŽ™์„ ๋ณด๋ฉด, core ์ˆ˜๊ฐ€ ์—„์ฒญ๋‚˜๊ฒŒ ๋งŽ์€ ๊ฑธ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค, ์•ž์„œ ๋ง์”€ํ•˜์‹  ์—…๋ฌด์˜ ํŠน์„ฑ๊ณผ ๊ด€๊ณ„๋ฅผ ๋ณด๋ฉด, ์–ด๋–ค ์„ค๊ณ„์˜ ๋ฐฉ์‹์ด ๋ฐ˜์˜๋˜์—ˆ๊ธฐ ๋•Œ๋ฌธ์— ๊ทธ๋Ÿฐ ํšจ์œจ์„ ๋‚ด๊ณ , ์ด๋ ‡๊ฒŒ ๋งŽ์€ core๋ฅผ ์ง‘์ ํ™” ํ™œ ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ธ๊ฐ€์š”? ๊ทธ๋ฆฌ๊ณ  CPU์˜ core์™€ GPU์˜ core๋Š” ๊ฒฐ์ •์ ์œผ๋กœ ๋‹ค๋ฅธ ์ ์ด ๋ฌด์—‡์ผ๊นŒ์š”?

> ํ˜„๋Œ€์ ์ธ CPU๋Š” ๋ง‰์—ฐํžˆ clock speed๊ฐ€ ๋†’๋‹ค cache๊ฐ€ ๋งŽ๋‹ค โ€“ ๊ทธ๋Ÿฐ ๊ฒƒ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, core๋‚ด์—์„œ ๋ณ‘๋ ฌํ™”๋ฅผ ํ†ตํ•ฉ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ์œ„ํ•ด CPU์˜ ํ•˜๋“œ์›จ์–ด instruction set์„ ์„ค๊ณ„ํ•  ๋•Œ branching์ด๋ผ๋“ ๊ฐ€ predication์ด๋ผ๋“ ๊ฐ€ ์—ฌ๋Ÿฌ๊ฐ€์ง€๊ฐ€ ๊ตฌํ˜„๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ์— ๋น„ํ•ด GPU๋Š” ๊ทธ๋Ÿฐ ๊ฒƒ๋“ค์ด ์ƒ๋žต๋œ, SIMD๊ฐ™์€ ‘๋‹จ์ˆœ์—ฐ์‚ฐ’์„ ํ•˜๋Š”๋ฐ ์ตœ์ ํ™”๋œ core๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์–ด์š”.

Branch: ๋ธŒ๋žœ์น˜(branch)๋Š” ์ปดํ“จํ„ฐ๊ฐ€ ๋‹ค๋ฅธ ๋ช…๋ น ์‹œํ€€์Šค๋ฅผ ์‹คํ–‰ํ•˜๊ธฐ ์‹œ์ž‘ํ•˜๊ฒŒ ํ•˜์—ฌ ๋ช…๋ น์„ ์ˆœ์„œ๋Œ€๋กœ ์‹คํ–‰ํ•˜๋Š” ๊ธฐ๋ณธ ๋™์ž‘์—์„œ ๋ฒ—์–ด๋‚˜๋Š” ์ปดํ“จํ„ฐ ํ”„๋กœ๊ทธ๋žจ์˜ ๋ช…๋ น์ด๋‹ค. ๋ธŒ๋žœ์น˜(๋˜๋Š” ๋ถ„๊ธฐ ๋œ ๋ธŒ๋žœ์น˜)๋Š” ๋˜ํ•œ ๋ถ„๊ธฐ ๋ช…๋ น์„ ์‹คํ–‰ ํ•œ ๊ฒฐ๊ณผ๋กœ์„œ ์‹คํ–‰์„ ๋‹ค๋ฅธ ๋ช…๋ น ์‹œํ€€์Šค๋กœ ์ „ํ™˜ํ•˜๋Š” ๋‹จ๊ณ„๋ฅผ ํฌํ•จํ•œ๋‹ค. ๋ถ„๊ธฐ ๋ช…๋ น์–ด๋Š” ์กฐ๊ฑด๋ถ€์— ๋”ฐ๋ผ ๋ถ„๊ธฐ๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฌด์กฐ๊ฑด ๋ถ€ ๋ถ„๊ธฐ ๋˜๋Š” ๋ถ„๊ธฐ๋ฅผ ์œ ๋ฐœํ•  ์ˆ˜๋„ ์žˆ๊ณ , ํ•˜์ง€ ์•Š์„ ์ˆ˜๋„ ์žˆ๋Š” ์กฐ๊ฑด ๋ถ„๊ธฐ์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ถ„๊ธฐ ๋ช…๋ น์€ ํ”„๋กœ๊ทธ๋žจ ๋ฃจํ”„ ๋ฐ ์กฐ๊ฑด(์ฆ‰, ํŠน์ • ์กฐ๊ฑด์ด ์ถฉ์กฑ๋˜๋Š” ๊ฒฝ์šฐ์—๋งŒ ํŠน์ • ๋ช…๋ น ์‹œํ€€์Šค๋ฅผ ์‹คํ–‰)์—์„œ ์ œ์–ด ํ๋ฆ„์„ ๊ตฌํ˜„ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋œ๋‹ค.
https://en.wikipedia.org/wiki/Branch_(computer_science)

Predication: ์ปดํ“จํ„ฐ ๊ณผํ•™์—์„œ ํ”„๋ ˆ๋””์ผ€์ด์…˜(Predication)์€ ์กฐ๊ฑด๋ถ€ ๋ถ„๊ธฐ ๋ช…๋ น์–ด์˜ ๋Œ€์•ˆ์„ ์ œ๊ณตํ•˜๋Š” ์•„ํ‚คํ…์ฒ˜ ๊ธฐ๋Šฅ์ด๋‹ค. ํ”„๋ ˆ๋””์ผ€์ด์…˜์€ ๋ธŒ๋žœ์น˜์˜ ๋‘ ๊ฒฝ๋กœ ๋ชจ๋‘์—์„œ ๋ช…๋ น์„ ์‹คํ–‰ํ•˜๊ณ  ์ทจํ•ด์ง„ ๊ฒฝ๋กœ์˜ ๋ช…๋ น ๋งŒ ์•„ํ‚คํ…์ฒ˜ ์ƒํƒœ๋ฅผ ์ˆ˜์ •ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•œ๋‹ค. ์ทจํ•ด์ง„ ๊ฒฝ๋กœ์˜ ๋ช…๋ น์–ด๋Š” ๋ช…๋ น์–ด๊ฐ€ ์•„ํ‚คํ…์ฒ˜ ์ƒํƒœ๋ฅผ ์ˆ˜์ •ํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ์—ฌ๋ถ€๋ฅผ ์ œ์–ดํ•˜๊ธฐ ์œ„ํ•ด ๋ช…๋ น์–ด๊ฐ€ ์‚ฌ์šฉํ•˜๋Š” ๋ถ€์šธ ๊ฐ’ ์ธ ์ˆ ์–ด๋กœ ์—ฐ๊ฒฐ (์˜ˆ์ธก)๋˜์–ด ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์•„ํ‚คํ…์ฒ˜ ์ƒํƒœ๋ฅผ ์ˆ˜์ •ํ•  ์ˆ˜ ์žˆ๋‹ค.
https://en.wikipedia.org/wiki/Branch_predication

SIMD: Single Instruction, Multiple Data๋ฅผ ์˜๋ฏธํ•œ๋‹ค. ๋งˆ์ดํด ํ”Œ๋ฆฐ์ด ๋ถ„๋ฅ˜(Flynn’s Taxonomy)ํ•œ ์ปดํ“จํ„ฐ ์•„ํ‚คํ…์ฒ˜์˜ ํ•œ ์ข…๋ฅ˜๋กœ, ๋‹จ์ˆ˜์˜ ๋ช…๋ น์–ด๋กœ ๋‹ค์ˆ˜์˜ ๊ฐ’์„ ๋™์‹œ์— ๊ณ„์‚ฐํ•˜๋Š” ๋ณ‘๋ ฌ์—ฐ์‚ฐ์˜ ํ•œ ๋ฐฉ์‹์ด๋‹ค.
https://en.wikipedia.org/wiki/SIMD

SIMD2.svg
By VadikusOwn work, CC BY-SA 4.0, Link

– ๊ทธ๋ ‡๋‹ค๋ฉด, ‘๋‹จ์ˆœ์—ฐ์‚ฐ’๊ณผ ๊ทธ๋ ‡์ง€ ์•Š์€ ์—ฐ์‚ฐ, ์ฆ‰ ‘๋ณต์žก์—ฐ์‚ฐ’์˜ ์ฐจ์ด๋ฅผ ์–ด๋–ป๊ฒŒ ๊ตฌ๋ถ„ํ•  ์ˆ˜ ์žˆ์„๊นŒ์š”?

> ๊ฐ€์žฅ ์‰ฌ์šด ๊ฑด if/then ์ฆ‰, ์กฐ๊ฑด๋ฌธ์ด ๋“ค์–ด ๊ฐ€๋Š๋ƒ? ์•„๋‹ˆ๋ƒ? ๋กœ ๊ตฌ๋ถ„ํ•˜๋Š” ๊ฒƒ์ด ์ œ์ผ ์ข‹์„ ๋“ฏ ํ•ฉ๋‹ˆ๋‹ค. ๋งŒ์•ฝ ์ƒˆ๋กœ ๋“ค์–ด์˜จ ๊ฐ’์ด 10๋ณด๋‹ค ํฌ๋ƒ? ์ž‘์œผ๋ƒ? ์— ๋”ฐ๋ผ์„œ ์—ฐ์‚ฐํ•˜๋Š” ๊ฒƒ์€ ๋ณต์žกํ•œ ์—ฐ์‚ฐ์œผ๋กœ GPU์— ์ ํ•ฉํ•˜์ง€ ์•Š๊ตฌ์š”, ๊ทธ๋ƒฅ ํ…Œ์ด๋ธ”์ด 100๋งŒ๊ฐœ ์นธ์ด ์žˆ๋Š” ํ–‰๋ ฌ์ด ๋‘ ๊ฐœ ์žˆ๋Š”๋ฐ, ๊ฐ™์€ ์นธ ๋ผ๋ฆฌ ๋™์‹œ์— ๋”ํ•˜๊ฑฐ๋‚˜ ๊ณฑํ•˜๊ฑฐ๋‚˜ ๋นผ๊ฑฐ๋‚˜ ๋‚˜๋ˆ„๊ฑฐ๋‚˜ ํ•˜๋Š” ๊ฒŒ ๋‹จ์ˆœ์—ฐ์‚ฐ์ด๊ณ , GPU์— ๋งž์ฃ .

– GPU์— ๋Œ€ํ•ด์„œ ์ฐพ์•„๋ณด๋ฉด co-processor๋ผ๋Š” ๋ง์ด ํ•ญ์ƒ ๋”ฐ๋ผ์˜ค๊ณ , ๋ถ€๋™์†Œ์ˆ˜์ ์—ฐ์‚ฐ์ด๋ผ๋Š” ๋ง๋„ ํ•จ๊ป˜ ์“ฐ์ด๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค, ๊ทธ๋Ÿผ GPU๋Š” co-processor์ด๊ณ , ํ•˜๋Š” ์ผ์€ ๋ถ€๋™์†Œ์ˆ˜์ ์—ฐ์‚ฐ์ด๋‹ค โ€“ ๋ผ๊ณ  ๋ด๋„ ๋ฌด๊ด€ํ• ๊นŒ์š”?

> ๋ฐ˜๋“œ์‹œ ๊ทธ๋Ÿฐ ๊ฒƒ์€ ์•„๋‹™๋‹ˆ๋‹ค. ์ง€๊ธˆ๊นŒ์ง€ GPU๊ฐ€ ์ฃผ๋กœ ํ•œ ์ผ์ด ๊ณผํ•™๊ธฐ์ˆ ์— ๊ด€๋ จ๋œ ์—ฐ์‚ฐ์ด๋‚˜ ๊ธˆ์œต์—…์—์„œ ํฌ๊ณ  ์ž‘์€ ์ˆซ์ž๋ฅผ ๊ณ„์‚ฐํ•˜๋Š”๋ฐ ์‚ฌ์šฉ๋˜์—ˆ๊ธฐ ๋•Œ๋ฌธ์— ๋ถ€๋™์†Œ์ˆ˜์ ๊ณ„์‚ฐ์ด ์–ธ๊ธ‰๋˜๋Š”๋ฐ, ์ฃผ๋กœ ์“ฐ์ž„์ด ๊ทธ๋ ‡๋‹ค ๋ณด๋‹ˆ ๊ทธ ๋ฐฉํ–ฅ์œผ๋กœ ๊ฐœ๋ฐœ๋˜์–ด ์™”๊ณ  ํ˜„์žฌ ๊ทธ๋ ‡๊ฒŒ ๋„๋ฆฌ ์‚ฌ์šฉ๋  ๋ฟ์ž…๋‹ˆ๋‹ค.

์ดˆ๊ธฐ microprocessor๋Š” ๋ถ€๋™์†Œ์ˆ˜์  ์—ฐ์‚ฐ์„ ์œ„ํ•œ ๋Šฅ๋ ฅ์„ ๋”ฐ๋กœ ๊ฐ–์ถ”๊ณ  ์žˆ์ง€ ์•Š์•˜๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ๋‹ค๋ฅธ ํ•˜๋“œ์›จ์–ด ์žฅ์น˜๋ฅผ ์‚ฌ์šฉํ•˜๊ธฐ๋„ ํ–ˆ๋‹ค. Co-processor๊ฐ€ ๋ฐ”๋กœ ๊ทธ๊ฒƒ์ด๋‹ค. PC ์ˆ˜์ค€์—์„œ ์ด์™€ ๊ฐ™์€ ์ด์•ผ๊ธฐ๋Š” ์•„๋งˆ๋„, Intel์˜ ์˜ค๋ž˜๋œ CPU๋ฅผ ๊ธฐ์–ตํ•ด ๋‚ธ๋‹ค๋ฉด, ๋ฐ”๋กœ ๊ทธ๊ฒƒ์ด๋‹ค. 486DX, 486SX๋“ฑ์˜ ์ด๋ฆ„์œผ๋กœ ์‹œ์žฅ์— ๋‚˜์™”๋‹ค. ์ด ์ค‘ SX๊ฐ€ ๋ถ€๋™์†Œ์ˆ˜์  ์—ฐ์‚ฐ์„ ์œ„ํ•œ ์„ค๊ณ„๊ฐ€ ๋ฐ˜์˜๋˜์ง€ ์•Š์€ ์ œํ’ˆ์ด์—ˆ๊ณ , DX๊ฐ€ ์ด๋ฅผ ๋ฐ˜์˜ํ•œ ์ œํ’ˆ์ด์—ˆ๋‹ค. ์ƒ๋Œ€์ ์œผ๋กœ SX๊ฐ€ ์ €๋ ด ํ–ˆ์œผ๋ฉฐ, ์ผ๋ฐ˜ PC ์‚ฌ์šฉ์ž์—๊ฒŒ ๋ถ€๋™์†Œ์ˆ˜์ ์—ฐ์‚ฐ์˜ ์ด์ ์ด ํฌ๊ฒŒ ์—†์—ˆ์Œ์œผ๋กœ ๋งŽ์€ ํŒ๋งค๊ฐ€ ์ด๋ฃจ์–ด์กŒ๋‹ค. ๋˜ํ•œ Intel์€ 487SX๊ณผ ๊ฐ™์€ co-processor๋ฅผ ๋”ฐ๋กœ ํŒ๋งคํ•˜๊ธฐ๋„ ํ•˜์˜€๋Š”๋ฐ, ‘Math CoProcessor’๋ผ๋Š” ์ด๋ฆ„์œผ๋กœ ์‹œ์žฅ์— ์•Œ๋ ธ๋‹ค. 486SX๋ฅผ ์‚ฌ์šฉํ•˜๋‹ค๊ฐ€ ๋‚˜์ค‘์— ์ด๋ฅผ ์ถ”๊ฐ€ํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•œ ์†Œ์ผ“๋„ ๋งˆ๋”๋ณด๋“œ์— ์œ„์น˜ํ•ด ์žˆ์—ˆ๋‹ค.

KL Intel i487SX.jpg
By Konstantin Lanzet (with permission) – CPU collection Konstantin Lanzet, received per EMail, CC BY-SA 3.0, Link

– co-processor ์‹œ์žฅ์„ ๋ณด๋ฉด, Nvidia์˜ Tesla, Intel์˜ Xeon-Phi๊ฐ€ ๋ˆˆ์— ๋•๋‹ˆ๋‹ค. Tesla์™€ Xeon-Phi์€ ์–ด๋–ค ์ ์—์„œ ์ฐจ์ด๋ฅผ ์„ค๋ช…ํ•  ์ˆ˜ ์žˆ์„๊นŒ์š”?

> ๊ฐ™์€ ์—ญํ• ์„ ์ˆ˜ํ–‰ํ•œ๋‹ค๋Š” ์ ์—์„œ๋Š” ๋น„์Šทํ•˜๋‹ค๊ณ  ๋งํ•  ์ˆ˜ ์žˆ๊ฒ ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ, ์ „ํ˜€ ๋‹ค๋ฅธ ์ œํ’ˆ์ž…๋‹ˆ๋‹ค. ์ฐจ์ด์ ์€ ์†Œํ”„ํŠธ์›จ์–ด ์ชฝ์—์„œ ์‰ฝ๊ฒŒ ์ฐพ์„ ์ˆ˜ ์žˆ๋Š”๋ฐ์š”, Nvidia๋Š” CUDA๋ผ๋Š” ๊ฐœ๋ฐœํ™˜๊ฒฝ์ด ์ œ๊ณต๋˜๊ณ  ํ˜„์žฌ๋Š” ์‚ฐ์—…ํ‘œ์ค€์ฒ˜๋Ÿผ ์‹œ์žฅ์—์„œ ์ธ์‹ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค, Nvdia์˜ GPU๋Š” CUDA์— ‘๋‹น์—ฐํžˆ’ ์ตœ์ ํ™” ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ์— ๋น„ํ•ด, Xeon-Phi๋Š”CUDA๊ณผ ๋น„๊ฒฌํ•  ๋งŒํ•œ ์—์ฝ”-์‹œ์Šคํ…œ์ด ์—†๋Š” ํ˜•ํŽธ์ž…๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  Xeo-Phi๋Š” Intel CPU์˜ ๊ธฐ์กด core๋“ค์„ ๊ต‰์žฅํžˆ ๋‹จ์ˆœํ™”ํ•˜์—ฌ ์ง‘์ ํ™” ์‹œํ‚จ, ๊ทธ๋Ÿฌ๋‹ˆ๊นŒ ๊ธฐ์กด x86 CPU์—์„œ ํฌ๊ฒŒ ๋ณ€ํ™”ํ•˜์ง€ ์•Š์€ ์ ์„ ๋“ค ์ˆ˜ ์žˆ๊ฒ ์Šต๋‹ˆ๋‹ค.
๋Œ€์‹  Xeon-Phi๋Š” ํŠน์ดํ•˜๊ฒŒ, co-processor mode๋กœ๋งŒ ์“ฐ์ด๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, host mode๋กœ๋„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ธฐ์กด์˜ x86 ํ”Œ๋žซํผ์˜ OS๋ฅผ ๊ทธ๋Œ€๋กœ ์‚ฌ์šฉํ•  ์ˆ˜๋„ ์žˆ๋‹ค๋Š” ๋œป์ž…๋‹ˆ๋‹ค. ๋ฌผ๋ก  ์„ฑ๋Šฅ์€ ๋Œ€๋‹จํžˆ ์ข‹์ง€ ์•Š๋‹ค๊ณ  ๋“ค์—ˆ์Šต๋‹ˆ๋‹ค.

– ํ•˜๋‚˜์˜ co-processor card๋ฅผ co-processor mode์™€ host mode๋กœ ์ „ํ™˜ํ•ด์„œ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์ด์•ผ๊ธฐ์ธ๊ฐ€์š”?

> co-processor๋กœ ์“ธ ์ˆ˜ ์žˆ๋Š” ํ•˜๋“œ์›จ์–ด์™€ host๋กœ ์“ธ ์ˆ˜ ์žˆ๋Š” ํ•˜๋“œ์›จ์–ด๋Š” ์„œ๋กœ ๋‹ค๋ฆ…๋‹ˆ๋‹ค. ์ƒํ˜ธ ์ „ํ™˜ํ•ด์„œ ์“ธ ์ˆ˜ ์žˆ๋Š” ๊ฑด ์•„๋‹™๋‹ˆ๋‹ค. ์žฌ๋ฏธ์žˆ๋Š” ์ ์€, Xeon-Phi ์ด์•ผ๊ธฐ๋ฅผ ๋งŽ์ด ๋“ค์–ด๋ณด๊ธฐ๋Š” ํ–ˆ์ง€๋งŒ, ์ง€๊ธˆ๊นŒ์ง€ ๋งŒ๋‚˜์˜จ ์—ฌ๋Ÿฌ ๊ณ ๊ฐ๋“ค ์ค‘์— Xeon-Phi๋ฅผ ML/DL์— ์‚ฌ์šฉํ•˜๋Š” ๊ฒฝ์šฐ๋ฅผ ๋ณด์ง€ ๋ชป ํ–ˆ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

Intel์˜ Xeon-Phi๋Š” ์ž์‚ฌ์˜ Atom ํ”„๋กœ์„ธ์„œ์™€ ๊ฐ™์€ core ๊ธฐ๋ฐ˜์œผ๋กœ ๋งŒ๋“ ๋‹ค๊ณ  ํ•œ๋‹ค. Intel Xeon Phi๋Š” processor์™€ Coprocessor๋กœ ๋ช…๋ช…๋œ ์ œํ’ˆ์ด ์žˆ๋‹ค. ๊ณต์‹ ๋ช…์นญ์—์„œ ์ด๋ ‡๊ฒŒ ๊ตฌ๋ถ„ํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ, Xeon Phi Processor๋Š” ์šด์˜์ฒด์ œ๋ฅผ ์ง์ ‘ ๋™์ž‘์‹œํ‚ฌ ์ˆ˜ ์žˆ๋Š” host๋กœ ์‚ฌ์šฉ๋˜๊ณ , Xeon Phi Coprocessor๋Š” co-processor๋กœ ์ปดํ“จํŒ… ์‹œ์Šคํ…œ์˜ PCIe Slot์— ์žฅ์ฐฉ๋œ๋‹ค.

Intel Xeon Phi Coprocessor ยฉ Intel

Intel Xeon Phi Processor๋กœ ๊ตฌ์„ฑ๋œ compute server ยฉ Intel

– ML/DL์— ๊ด€ํ•œ ๊ธ€์„ ์ฐพ์•„๋ณด๋ฉด GPU์— ๋Œ€ํ•œ ์–ธ๊ธ‰์ด ์•„์ฃผ ๋งŽ์Šต๋‹ˆ๋‹ค. ์„ธ๊ณ„์ ์ธ ML/DL ๊ถŒ์œ„์ž์ธ Andrew Ng[ๅณๆฉ้”]์˜ ๊ฐ•์˜๋ฅผ ๋ด๋„ GPU์˜ ์—ญํ• ์— ๋Œ€ํ•˜์—ฌ ์–ธ๊ธ‰ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๋‘˜์˜ ๊ด€๊ณ„๋Š” ์•ž์„œ ๋ง์”€ํ•ด ์ฃผ์‹  ‘๋‹จ์ˆœ์—ฐ์‚ฐ’ ์˜์—ญ์—์„œ GPU๊ฐ€ ํƒ์›”ํ•˜๊ณ  ML/DL์€ ๊ทธ๋Ÿฌํ•œ ‘๋‹จ์ˆœ์—ฐ์‚ฐ’์˜ ์˜์—ญ์— ์žˆ๋Š” ์ปดํ“จํŒ…์ด๊ธฐ ๋•Œ๋ฌธ์ด๋ผ๊ณ  ์ดํ•ดํ•˜๋„ ๋ ๊นŒ์š”?

> ML/DL์— ๋ฐ˜๋“œ์‹œ GPU๋ฅผ ์‚ฌ์šฉํ•ด์•ผ ํ•˜๋Š” ๊ฑด ์•„๋‹™๋‹ˆ๋‹ค. ์–ด๋–ค ๋Œ€๊ทœ๋ชจ neural network์„ ์šด์˜ํ•˜๋Š” ๊ณณ์—์„œ CPU๋ฅผ ๋” ๋งŽ์ด ์‚ฌ์šฉํ•œ๋‹ค๋Š” ์ด์•ผ๊ธฐ๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ์•„์‹œ๋‹ค์‹œํ”ผ Google ๊ฐ™์€ ๊ณณ์€ TPU๋ฅผ ์ž์ฒด ์ œ์ž‘ํ•˜์—ฌ ์“ฐ๊ณ  ์žˆ๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค. ๋‹ค๋งŒ, GPU๋ฅผ ๋„๋ฆฌ ์–ธ๊ธ‰ํ•˜๋Š” ๊ฒƒ์€ ๊ทธ๊ฒƒ์ด ๋น„์šฉํšจ์œจ์ ์ด๊ธฐ ๋•Œ๋ฌธ์ด๋ผ๊ณ  ์ „ ์ดํ•ดํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

– ๊ฒฐ๊ตญ ํ•˜๋“œ์›จ์–ด ์ค‘์‹ฌ์˜ ํŠน๋ณ„ํ•œ ๊ธฐ์ˆ ์ ์ธ ์žฅ์ ๋ณด๋‹ค๋Š” ์–ด๋–ค ๊ธฐ์ˆ ์˜ ๋„์ž…์ด๋“  ์„ฑ๋Šฅ๋Œ€๋น„ ๋น„์šฉํšจ์œจ์ด๋ฉด ML/DL์—์„œ ์ข‹์€ ์‹œ์Šคํ…œ์ด๋ผ๊ณ  ํŒ๋‹จํ•  ์ˆ˜ ์žˆ๊ฒ ๊ตฐ์š”. ๊ทธ๋ ‡๋‹ค๋ฉด, ์ตœ๊ทผ IBM์ด ์‹œ์žฅ์— ์„ ๋ณด์ด๊ณ  ์žˆ๋Š” GPU ์‹œ์Šคํ…œ์ธ, S822LC for HPC๋Š” ์–ด๋–ค ์ œํ’ˆ์ž…๋‹ˆ๊นŒ?

> ๊ธฐ์ˆ ์ ์ธ ์žฅ์  ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ๋น„์šฉํšจ์œจ์ ์ธ ์šด์˜๋ฉด์—์„œ๋„ ์ข‹์€ ์‹œ์Šคํ…œ์ž…๋‹ˆ๋‹ค. ํŠนํžˆ, ๋‹ค๋ฅธ ์ œํ’ˆ์—์„œ๋Š” ํ•ด๊ฒฐํ•˜์ง€ ๋ชป ํ•˜๊ณ  ์žˆ๋Š” ๋ฌธ์ œ, GPU์™€ CPU ๊ฐ„์˜ ๋ณ‘๋ชฉ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•œ ์ ์—์„œ๋Š” ๋†’์€ ๊ฐ€์น˜๊ฐ€ ์žˆ๋Š” ์‹œ์Šคํ…œ์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

IBM S822LC for HPC๋Š” ML/DL์„ ์œ„ํ•ด ๋””์ž์ธ ๋˜์–ด ์žˆ๋‹ค. 2U form factor ํฌ๊ธฐ์ธ ์ด ์‹œ์Šคํ…œ์€ ํ‘œ์ค€ 19์ธ์น˜ ๋ž™ ๋งˆ์šดํŠธ ํ˜•์‹์œผ๋กœ, GPU๋กœ๋Š” Nvidia Tesla P100์ด ํƒ‘์žฌ๋˜๊ณ  ์ด ์ˆ˜๋Ÿ‰์€ 4๊ฐœ๊นŒ์ง€ ์ˆ˜์šฉ๋œ๋‹ค. CPU๋Š” Power8 2 ์†Œ์ผ“์œผ๋กœ ๊ตฌ์„ฑ๋˜๋ฉฐ ์ด 20๊ฐœ ํ˜น์€ 24๊ฐœ core ๊ตฌ์„ฑ์ด ๊ฐ€๋Šฅํ•˜๊ณ  core ๋‹น 8๊ฐœ threads๋ฅผ ์ œ๊ณตํ•œ๋‹ค. ๋ฉ”๋ชจ๋ฆฌ๋Š” 32GB ๊ตฌ์„ฑ์—์„œ 1024GB ๊ตฌ์„ฑ๊นŒ์ง€ ๊ฐ€๋Šฅํ•˜๋‹ค. ๋˜ํ•œ, ๋Œ€๊ทœ๋ชจ ๊ตฌ์„ฑ์„ ์œ„ํ•œ ์ˆ˜๋ƒ‰์‹ ์˜ต์…˜๋„ ์ œ๊ณตํ•œ๋‹ค.

์šด์˜์ฒด์ œ๋กœ๋Š” ํ˜„์žฌ Ubuntu๊ฐ€ ๊ณต์‹ ์ง€์›๋˜๋ฉฐ ๊ณง RHEL๋„ ๊ทธ ๋ชฉ๋ก์— ๋“ค์–ด์˜ฌ ๊ฒƒ์ด๋‹ค.
S822LC for HP, ์ด ์ œํ’ˆ์€ ๋ฌด์—‡๋ณด๋‹ค Nvidia๊ฐ€ ์„ค๊ณ„ํ•œ NVLink๊ฐ€ ์ตœ์ดˆ๋กœ ๋ฐ˜์˜๋œ ์‹œ์Šคํ…œ์ด๋‹ค. ์ด NVLink๋Š” ๊ธฐ์กด PCIe 3.0 x16 ๋Œ€๋น„ 5๋ฐฐ ๋„“์€ ๋Œ€์—ญํญ์„ ์ž๋ž‘ํ•˜๋ฉฐ CPU์™€ GPU ๊ทธ๋ฆฌ๊ณ  GPU์™€ GPU๋ฅผ ์ง์ ‘(Peer-to-Peer)์—ฐ๊ฒฐํ•œ๋‹ค. ์ด๋ฅผ ํ†ตํ•˜์—ฌ ML/DL์—์„œ ํ•ญ์ƒ ํ•˜๋“œ์›จ์–ด์˜ ์ œ์•ฝ์œผ๋กœ ์ƒ๊ฐ๋˜๋˜ PCIe ๋ฒ„์Šค์˜ I/O ๋ณ‘๋ชฉํ˜„์ƒ์„ ํš๊ธฐ์ ์œผ๋กœ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค.

IBM S822LC for HPC

– ์ด๋Ÿฐ ์ œํ’ˆ์„ ๊ณ ๊ฐ๊ณผ ์ด์•ผ๊ธฐ๋ฅผ ํ•ด ๋ณด๋ฉด, ์‹ค์ œ๋กœ IBM ์™“์Šจ์œผ๋กœ ๋Œ€ํ‘œ๋˜๋Š” ํด๋ผ์šฐ๋“œ ์ปดํ“จํŒ… ๊ธฐ๋ฐ˜์˜ intelligence services์™€ ๋น„๊ต๋ฅผ ๋งŽ์ด ํ•œ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. S822LC for HPC์™€ ํด๋ผ์šฐ๋“œ ๊ธฐ๋ฐ˜์˜ intelligence services๋ฅผ ๋‹จ์ ์ธ ์ฐจ์ด์ ์„ ๋ง์”€ ํ•ด ์ฃผ์‹ ๋‹ค๋ฉด?

> ๋‚ด๊ฐ€ ๊ณ ๊ธฐ๋ฅผ ์‚ฌ์„œ ๊ณ ๊ธฐ๋ฅผ ๊ตฌ์›Œ ๋จน๋Š๋ƒ? ์Œ์‹์ ์— ๊ฐ€์„œ ์Šคํ…Œ์ดํฌ๋ฅผ ์‹œ์ผœ ๋จน๋Š๋ƒ? ์™€ ์ •ํ™•ํžˆ ์ผ์น˜ํ•œ๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ˜ธ์ˆ˜์‚ฐ ์™€๊ทœ๋“  ๊ตญ๋‚ด์‚ฐ ํ•œ์šฐ๋“  ๋‚ด ๊ธฐํ˜ธ์™€ ์˜ˆ์‚ฐ์— ๋งž์ถ”์–ด ์ง์ ‘ ๊ณ ๊ธฐ๋ฅผ ๊ณ ๋ฅผ ์ˆ˜ ์žˆ๊ณ , ๋ฌด์—‡๋ณด๋‹ค ์ค‘์š”ํ•œ ๊ฑด ๊ตฝ๋Š” ๋ฐฉ๋ฒ• ๋“ฑ์„ ์Šค์Šค๋กœ ์ฑ„๋“ํ•˜์—ฌ ์ง€์ ์ž์‚ฐ์œผ๋กœ ๋ณด์œ ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์ด ์žˆ๊ฒ ์ฃ . ๊ทธ๊ฒŒ ์•„๋‹ˆ๊ณ , ๊ณ ๊ธ‰ ๋ ˆ์Šคํ† ๋ž‘์— ๊ฐ€์„œ ์‚ฌ๋จน์œผ๋ฉด ํ™•์‹คํžˆ ๋น ๋ฅธ ์‹œ๊ฐ„ ๋‚ด์— ๋” ์ข‹์€ ๊ฒƒ์„ ๋จน์„ ์ˆ˜ ์žˆ๊ธด ํ•œ๋ฐ, ๋ˆ๋„ ๋งŽ์ด ๋“ค๊ณ  ์ž์‹ ์—๊ฒŒ (๊ฒฝํ—˜๊ณผ ์ง€์‹์ด) ์Œ“์ด๋Š” ๊ฑด ํ›จ์”ฌ ๋” ์ ๊ฒ ์ฃ .

– ๊ฐ€๊นŒ์šด ๋ฏธ๋ž˜์—, GPU ํ˜น์€ GPU์™€ ๊ฐ™์€ co-processor๊ฐ€ ๋ณดํŽธ์ ์ธ ์ปดํ“จํŒ… ์‹œ์Šคํ…œ์— ์ „๋ฐ˜์ ์œผ๋กœ ํƒ‘์žฌ๋  ๊ฐ€๋Šฅ์„ฑ์€ ์žˆ์„๊นŒ์š”?

> ๊ทธ๋Ÿด ๊ฐ€๋Šฅ์„ฑ์€ ์—†๋‹ค๊ณ  ๋ด…๋‹ˆ๋‹ค. ๋ณดํŽธ์ ์ธ ์ปดํ“จํŒ… ์œ ํ˜•๊ณผ co-processor๊ฐ€ ํ•„์š”ํ•œ ์˜์—ญ์€ ํ™•์—ฐํžˆ ๊ตฌ๋ถ„๋ฉ๋‹ˆ๋‹ค. ML/DL ํ˜น์€ ์œ ์‚ฌํ•œ ๋ถ„์•ผ์— ์ฐธ์—ฌํ•˜๋Š” ๊ธฐ์—… โ‹… ์—ฐ๊ตฌ์†Œโ‹… ๊ฐœ์ธ์€ ์ง€๊ธˆ๋ณด๋‹ค ํ™•์‹คํžˆ ๋Š˜์–ด๋‚˜๊ฒ ์ฃ , ๊ทธ์— ๋”ฐ๋ฅธ ์‹œ์žฅ๋„ ํ™•๋Œ€๋˜๋Š” ๊ฑด ์˜ˆ์ƒํ•  ์ˆ˜ ์žˆ๊ฒ ์Šต๋‹ˆ๋‹ค.

– Power Systems์˜ ๋กœ๋“œ๋งต์„ ๋ณด๋ฉด, ์ฐจ์„ธ๋Œ€ POWER CPU, POWER9์—์„œ OpenCAPI(CAPI 3.0)์™€ NVLink 2.0๋ฅผ ๋™์‹œ์— ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์œผ๋กœ ๋ณด์ด๋Š”๋ฐ์š”, ์ด ๋‘๊ฐ€์ง€๊ฐ€ ํ•˜๋‚˜์˜ ๋ฒ„์Šค์ธ๊ฐ€์š”? ์•„๋‹ˆ๋ฉด ๊ฐ์ž์˜ ๋…๋ฆฝ๋œ ๋ฒ„์Šค๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์ธ๊ฐ€์š”?

> POWER9์— ์‚ฌ์šฉํ•˜๋Š” OpenCAPI์™€ NVLink์˜ ์ฐจ์„ธ๋Œ€ 2.0 ๋ฒ„์ „์€ ๊ฐ™์€ ๋ฒ„์Šค๋ฅผ ์”๋‹ˆ๋‹ค. 25GB/s ๋งํฌ์ž…๋‹ˆ๋‹ค. ์ด๋Š” PCIe์™€๋Š” ๊ด€๊ณ„๊ฐ€ ์—†๊ณ , PCIe๋„ 4.0์œผ๋กœ ์†Œ๊ฐœ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค. 

IBM ์„œ๋ฒ„ ์ปดํ“จํŒ… ํ”Œ๋žซํผ์˜ ์ฐจ์„ธ๋Œ€ CPU์ธ POWER9์€ 2017๋…„ ๋ง์— ์‹œ์žฅ์— ์†Œ๊ฐœ๋  ์˜ˆ์ •์ด๋‹ค. CAPI 3.0 ์ฆ‰, OpenCAPI๋ผ๋Š” IBM์˜ ๋ฒ„์Šค ๊ธฐ์ˆ ๊ณผ Nvidia์˜ NVLink 2.0์„ ๋™์‹œ์— ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์„ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, PCIe Gen 4๋„ ํƒ‘์žฌ๋  ๊ฒƒ์œผ๋กœ ์•Œ๋ ค์ ธ ์žˆ๋‹ค. CPU์™€ I/O ๋ชจ๋‘ ์ƒˆ๋กœ์šด ์„ธ๋Œ€๋กœ ๋ณธ๊ฒฉ ์ง„์ž…ํ•˜๊ฒŒ ๋œ๋‹ค. Nvidia๋Š” NVLink 2.0์„ POWER9์„ ํ†ตํ•ด ์ฒ˜์Œ ์„ธ์ƒ์— ์„ ๋ณด์ด๊ฒŒ ๋˜๊ณ , ์ด ๋•Œ ํ˜„์žฌ Tesla Pascal์˜ ๋‹ค์Œ ์„ธ๋Œ€์ธ, Tesla Volta๊ฐ€ ์‹œ์žฅ์— ๋‚˜์˜ฌ ๊ฒƒ์œผ๋กœ ์•Œ๋ ค์ง€๊ณ  ์žˆ๋‹ค.
์ด์— ๋Œ€ํ•œ ์ƒ์„ธํ•œ ์ •๋ณด๋Š” IBM developerWorks์— ์†Œ๊ฐœ๋˜๊ณ  ์žˆ๋‹ค.

CAPI์— ๋Œ€ํ•œ ์ •๋ณด๋Š” Wikipedia์— ์ž˜ ์ •๋ฆฌ๋˜์–ด ์žˆ๋‹ค.

X X X X X

ํ† ๋ก  ์ฐธ๊ฐ€

์ด๋ฉ”์ผ์€ ๊ณต๊ฐœ๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ํ•„์ˆ˜ ์ž…๋ ฅ์ฐฝ์€ * ๋กœ ํ‘œ์‹œ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค.