HBM과 GDDR 분기점 분석 — Bandwidth·Capacity·Cost 트레이드오프
HBM과 GDDR의 분기점 — bandwidth·capacity·cost의 트레이드오프와 시장 분할.
PCIe, NVMe, DDR, CXL, HBM, UCIe, UALink
HBM과 GDDR의 분기점 — bandwidth·capacity·cost의 트레이드오프와 시장 분할.
Base die + DRAM die stack — 3D 메모리의 구성요소와 TSV·microbump의 역할.
세대별 bandwidth·capacity·signaling — JEDEC 표준의 진화 흐름.
고속 그래픽 메모리 — clock·PAM 신호의 진화로 32 Gbps에 도달한 경로.
Theoretical vs achievable — 메모리 대역폭의 실제와 roofline·memory wall.
HBM stack의 열 부하·power state·refresh의 cost와 냉각 솔루션.
Bank·row·column·command — 컨트롤러가 보는 HBM과 scheduling·address mapping.
Weight·activation·KV cache — HBM 자리잡기와 시리즈 마무리.
CXL.mem이 메모리 계층에 끼어드는 자리 — on-package HBM과 DRAM DIMM 사이의 새 tier.
CXL.mem 트랜잭션 흐름 — M2S Req·S2M NDR/DRS, HDM Decoder의 주소 매핑, BI·Snoop Filter 동작.
CXL 디바이스 세 유형 — Type 1 (cache-only), Type 2 (accelerator with memory), Type 3 (memory expander)의 사용 사례와 트래픽 패턴.
CXL 2.0/3.x switch가 만드는 메모리 풀링 — 다중 호스트가 공유하는 메모리 풀과 Coherent Fabric 토폴로지.
PCIe 아키텍처의 기초 — point-to-point 직렬 링크, 3-Layer 모델, Root Complex·Switch·Endpoint 토폴로지, Gen 1부터 7.0까지의 진화.
PCIe의 기본 packet인 TLP — 3/4 DW header·5 가족·split transaction·라우팅 3 방식·Producer-Consumer ordering.
PCIe Configuration Space — 256 byte PCI 영역 + 4 KB Extended·Type 0/1 header·Capability chain·ECAM 메모리 매핑.
Base Address Register — Memory·I/O·64-bit·Prefetchable·size 결정·ReBAR·SR-IOV VF BAR.
PCIe 인터럽트 메커니즘 3가지 — Legacy INTx·MSI 32 vector·MSI-X 2048 vector·IOMMU Interrupt Remapping.
PCIe 전력 관리 — Device D0~D3·Link L0~L3·ASPM·L1 substates·CLKREQ·PME 흐름.
PCIe 에러 분류·계층별 처리·AER capability·DPC containment·Linux 복구 callback.
PCIe DLL — ACK/NAK·replay buffer·credit-based flow control·LCRC·Gen 6+ FLIT mode.
PCIe Physical Layer — LTSSM 11 state·link training timeline·4-phase equalization·TS1/TS2·SKP·encoding 진화.
Linux kernel의 PCIe — boot enumeration·struct pci_dev·driver matching·probe/remove·sysfs entry·ACPI 통합.
Linux DMA API — coherent·streaming·scatter-gather·IOMMU mapping·ATS·PRI·PASID·SVM·IOMMUFD.
PCIe hardware virtualization — SR-IOV PF/VF·VFIO container/group/device·DPDK·SPDK·ACS·FLR.
Guest 측 vIOMMU·Intel S-IOV·VirtIO·vDPA·live migration·Confidential I/O (IDE·TDISP·CMA-SPDM).
PCIe 운영 — pciehp surprise·orderly hot-plug·AER recovery callback chain·DPC integration·ARI 256+ function·EEH.
PCIe 디버깅 도구 — lspci 전체 옵션·setpci raw access·pcimem BAR R/W·protocol analyzer·debugfs.
Device not visible·link training fail·downgrade·CE storm·hang·ACS group·hot-plug·성능 미달·lane reversal·power budget.
PCIe 성능 — theoretical vs effective BW·MaxPayload·MaxReadReq·latency breakdown·NUMA·P2P·ASPM 영향·tuning.
PCIe register reference — Type 0/1 header·PCIe Cap·AER·MSI·MSI-X·SR-IOV·ACS·LTR의 주요 비트 layout.
코어 동작 너머의 PCIe spec 기능들 — Lane Margining(신호 마진 측정)·10-bit Tag(outstanding 확장)·TPH(캐시 주입 힌트)·ACS(격리)·L0p(부분폭 저전력)을 실무 관점에서 정리합니다.
CXL이 푸는 문제, 세대별 진화, 4.0의 핵심 변경 (128 GT/s·Bundled Port).
CXL 디바이스 분류와 multi-LD·multi-head 구조.
Host-managed Device Memory 두 종류와 일관성 메커니즘.
CXL 2.0 pooling, CXL 3.x fabric, GFAM (Global Fabric Attached Memory).
PCIe 7.0 기반 128 GT/s, Bundled Port·Streamlined Port의 동기와 효과.
CXL.io 프로토콜의 PCIe 호환성과 CXL 고유 확장.
디바이스가 호스트 메모리를 캐시하는 프로토콜.
호스트가 디바이스 메모리를 load/store하는 프로토콜.
Flit 단위 구조의 세대 별 변화.
같은 PHY에 CXL.io·CXL.cache·CXL.mem을 시분할로 흘리는 layer.
Linux 6.x의 CXL subsystem 코드 구조와 probe 흐름.
QEMU 8.0+의 CXL Type 3 에뮬레이션과 드라이버 검증 워크플로.
CXL switch의 진화와 Fabric Manager의 역할.
CXL 보안 메커니즘 4종의 위치와 관계.
Reliability·Availability·Serviceability, 성능 고려사항, Compliance Testing.