Chapter 5: Digital Building Blocks | 프로세서를 구성하는 핵심 블록
🧱 Chapter 5: Digital Building Blocks
가산기, ALU, 시프터, 부동소수점, 메모리 — 프로세서를 구성하는 핵심 블록
Chapter 1~4에서 논리 게이트, 조합/순차 논리, HDL 코딩을 익혔다면, 이제 이 조각들을 프로세서를 구성하는 실제 빌딩 블록으로 조립할 차례입니다. Chapter 5는 산술 회로(Adder, ALU), 시프터, IEEE 754 부동소수점, 그리고 메모리(SRAM, DRAM)를 다루며, 이들이 어떻게 마이크로프로세서의 데이터패스를 이루는지 보여줍니다. 2026년 최신 트렌드로는 AI 시대의 핵심인 HBM4 메모리 혁명을 함께 살펴봅니다.
➕ 1. 산술 회로 (Arithmetic Circuits)
🔢 반가산기 & 전가산기
모든 산술 연산의 근간은 덧셈입니다. 반가산기(Half Adder)는 2비트를, 전가산기(Full Adder)는 하위 캐리를 포함한 3비트를 더합니다.
⚡ 멀티비트 가산기: 속도의 전쟁
CLA는 캐리 체인을 “펼쳐서(unroll)” 표현합니다. 예를 들어, C2 = G2 + P2G1 + P2P1G0 + P2P1P0Cin처럼 모든 캐리가 원래 입력과 Cin으로만 표현되므로, 중간 캐리를 기다릴 필요 없이 2단계의 게이트 지연으로 계산됩니다. 실제 프로세서에서는 4비트 CLA 블록을 트리 구조로 연결하여 32/64비트 고속 가산기를 구현합니다.
🧠 2. 산술 논리 연산 장치 (ALU)
ALU는 마이크로프로세서의 심장입니다. 제어 신호(ALUControl)에 따라 덧셈, 뺄셈, AND, OR, XOR, SLT(Set Less Than) 등 다양한 연산을 하나의 하드웨어 블록에서 선택적으로 수행합니다.
뺄셈: B를 반전 + Cin=1 → 가산기가 A + (~B + 1) = A - B 수행
↔️ 3. 시프터 (Shifters)
이진수를 좌우로 이동시키며, 2의 거듭제곱 곱셈/나눗셈을 하드웨어 효율적으로 수행합니다.
| 유형 | 동작 | 예시 (8-bit, 2칸 시프트) | 용도 |
|---|---|---|---|
| 논리 좌시프트 (LSL) | 빈자리 0으로 채움 | 1100_0011 → 0000_1100 | × 2n |
| 논리 우시프트 (LSR) | 빈자리 0으로 채움 | 1100_0011 → 0011_0000 | Unsigned ÷ 2n |
| 산술 우시프트 (ASR) | 부호 비트 복제 | 1100_0011 → 1111_0000 | Signed ÷ 2n |
| 순환 시프트 (Rotate) | 밀려난 비트가 반대쪽으로 | 1100_0011 → 0000_1111 | 암호화, CRC |
하드웨어에서 시프터는 보통 배럴 시프터(Barrel Shifter)로 구현됩니다. N비트 배럴 시프터는 log2N 단계의 멀티플렉서 계층으로 구성되어, 임의의 시프트 양을 단 한 클럭 사이클에 처리합니다.
🔬 4. IEEE 754 부동소수점
고정소수점으로는 아주 크거나 작은 수를 효율적으로 표현할 수 없습니다. IEEE 754 부동소수점 표준은 과학적 표기법(scientific notation)의 2진수 버전으로, 현대 모든 프로세서와 GPU가 이 표준을 사용합니다.
1비트
8비트 (바이어스 127)
23비트 (숨겨진 1. 포함)
| 값 | E | F | 의미 |
|---|---|---|---|
| 0 | 0000 0000 | 000...0 | 양의 0 (S=0) 또는 음의 0 (S=1) |
| ∞ | 1111 1111 | 000...0 | +∞ (S=0) 또는 -∞ (S=1) |
| NaN | 1111 1111 | ≠ 0 | Not a Number (0/0, √-1 등) |
| 비정규화수 | 0000 0000 | ≠ 0 | 0에 가까운 매우 작은 수 (0.F × 2-126) |
💾 5. 메모리 배열 (Memory Arrays)
데이터를 저장하고 읽는 2차원 배열 구조입니다. N비트 주소로 2N개의 워드 중 하나에 접근합니다. 메모리는 프로세서 성능의 병목이 되는 경우가 많아, “Memory Wall” 문제는 컴퓨터 아키텍처의 핵심 도전 과제입니다.
| 특성 | SRAM | DRAM |
|---|---|---|
| 셀 구조 | 6T (6 트랜지스터) | 1T1C (1 트랜지스터 + 1 커패시터) |
| 속도 | 매우 빠름 (~1ns) | 상대적 느림 (~50ns) |
| 밀도 | 낮음 (면적 큼) | 높음 (면적 작음) |
| 리프레시 | 불필요 | 필수 (~64ms 주기) |
| 주 용도 | 캐시 (L1/L2/L3) | 메인 메모리, HBM |
| 비용/비트 | 높음 | 낮음 |
🚀 6. 2026년 산업 동향: HBM4 메모리 혁명
교과서에서 배운 DRAM의 원리는 2026년 현재 HBM4(High Bandwidth Memory 4)라는 형태로 AI 시대의 핵심 인프라가 되었습니다. CES 2026에서 메모리 3사(SK hynix, Samsung, Micron) 모두 HBM4를 공개하며 “메모리 전쟁”이 본격화되었습니다.
HBM4는 교과서의 DRAM 셀(1T1C)을 수직으로 최대 16층 적층하고, 2,048비트 인터페이스로 대역폭을 극대화한 기술입니다. JEDEC이 2025년 4월에 공식 사양을 발표했으며, 2026년 양산이 본격화되고 있습니다.
📊 교과서 DRAM → HBM4 진화 매핑
| 교과서 개념 | HBM4에서의 진화 |
|---|---|
| 1T1C DRAM 셀 | 동일 원리. 1c nm급(10nm 6세대) 공정으로 셀 크기 극소화 |
| 리프레시 필요 | 여전히 필수. 하지만 온도 감지형 적응적 리프레시로 전력 절감 |
| 단일 칩 인터페이스 | TSV(Through-Silicon Via)로 최대 16 DRAM 다이 수직 적층. 2,048비트 인터페이스 |
| 수동 저장 장치 | 로직 베이스 다이 통합으로 “능동 메모리” 진화 (Custom HBM, PIM 개념) |
| 대역폭 한계 | 스택당 2TB/s+. 이전 세대 HBM3 대비 2.54배 대역폭 향상 |
글로벌 반도체 시장이 약 9,750억 달러에 달할 것으로 전망되는 가운데, 메모리 부문이 30% 성장하며 4,400억 달러를 넘어설 전망입니다. HBM 시장만 약 546억 달러로 전년 대비 58% 성장이 예상되며, AI 인프라 투자가 핵심 동력입니다. 특히 HBM4는 NVIDIA Rubin, Google TPU 등 차세대 AI 가속기의 필수 부품으로, 생산 물량이 출시 전부터 전량 매진되는 초유의 상황입니다.
📋 핵심 요약
| 주제 | 핵심 포인트 | 핵심 수식 / 키워드 |
|---|---|---|
| 가산기 | RCA: O(N) 지연, CLA: O(log N) 지연. G/P 병렬 계산 | Ci=Gi+PiCi-1 |
| ALU | 제어 신호로 ADD/SUB/AND/OR/SLT 선택. 뺄셈=2의 보수 활용 | ALUControl MUX |
| 시프터 | LSL/LSR/ASR/Rotate. 배럴 시프터로 1사이클 구현 | ×2n, ÷2n |
| IEEE 754 | S(1) + E(8) + F(23) = 32비트. 바이어스 127 | (-1)S×1.F×2E-127 |
| 메모리 | SRAM(6T, 빠름, 캐시) vs DRAM(1T1C, 밀도, 메인) | 2N 워드 주소공간 |
| 2026 트렌드 | HBM4: 16층, 2048bit I/F, 2TB/s+. AI 메모리 슈퍼사이클 | 시장 $54.6B (HBM) |
댓글
댓글 쓰기