CMake 옵션과 캐시 변수 — option·set·cache type 분석
사용자 설정 가능한 빌드 옵션과 CMake 캐시 시스템.
10개의 포스트
사용자 설정 가능한 빌드 옵션과 CMake 캐시 시스템.
1024×1024 matrix multiply가 이론값의 10배 느렸다. SIMD부터 의심했지만 진짜 범인은 캐시 미스 90%였다.
Burst size 최적화. Scatter-gather, chain. Cache clean/invalidate, double buffer.
64-byte line alignment, software prefetch, false sharing 회피, SoA·AoS 선택.
Cold/Compulsory, Capacity (working set > cache), Conflict (associativity 한계).
Cache hierarchy. Direct mapped vs N-way set associative. LRU·PLRU·Random.
왜 느린가? Cache miss, pipeline stall, bus contention부터 profiling 도구 활용까지. 임베디드 시스템 성능 분석의 모든 것.
False sharing의 원리와 영향, perf c2c 감지, alignas(64) padding, per-CPU 변수, thread-local까지 해결 전략을 정리합니다.
Cache line 정렬과 false sharing 회피, hot/cold 분리, SoA 변환을 코드와 측정으로 정리합니다.
I-Cache/D-Cache·write-through vs write-back·invalidate/clean.