Memory Diagnostics · 7/7

Tiered Memory 진단 — DAMON·DAMOS·Promotion/Demotion 디버깅

2026년 6월 18일 · Hawk · 5분 읽기

tiered-memory damon damos cxl promotion demotion

#DAMON 기본 동작 모델

DAMON은 page activity를 적은 오버헤드로 측정하는 메커니즘입니다. 3단계:

단계	동작
1. Region sampling	메모리를 region으로 나누어 각 region 내 random page 1개만 sampling
2. Access counting	sampling된 page의 PTE Access bit 확인
3. Aggregation	일정 시간 누적 → access 빈도로 환산

이렇게 전체를 안 보고 sampling해 오버헤드 1% 이하.

#DAMON 파라미터 튜닝

파라미터	의미	기본	권장
sample_interval	sampling 주기	5ms	5~10ms
aggr_interval	aggregation 주기	100ms	100~500ms
min_nr_regions	최소 region 분할	10	10~100
max_nr_regions	최대 region 분할	1000	1000~10000
ops	operation set	vaddr	paddr (system-wide) 또는 vaddr (per-process)

1
# 파라미터 설정
2
$ echo 5000 > /sys/kernel/mm/damon/admin/kdamonds/0/contexts/0/monitoring_attrs/intervals/sample_us
3
$ echo 200000 > /sys/kernel/mm/damon/admin/kdamonds/0/contexts/0/monitoring_attrs/intervals/aggr_us
4
$ echo 100 > /sys/kernel/mm/damon/admin/kdamonds/0/contexts/0/monitoring_attrs/min_nr_regions
5
$ echo 10000 > /sys/kernel/mm/damon/admin/kdamonds/0/contexts/0/monitoring_attrs/max_nr_regions
6

7
# 활성화
8
$ echo on > /sys/kernel/mm/damon/admin/kdamonds/0/state

sample_interval이 너무 작으면 (1ms 이하) DAMON 자체 오버헤드가 큽니다.

#DAMOS — 자동 액션

*DAMOS (DAMON-based Operation Schemes)*는 DAMON 측정 결과에 따라 자동 액션을 취합니다.

Action	의미
pageout	swap으로 강제 page out
migrate_hot	hot page를 상위 tier로 promotion
migrate_cold	cold page를 하위 tier로 demotion
lru_prio	LRU 우선순위 높임
lru_deprio	LRU 우선순위 낮춤
stat	통계만 (action 없음)
nohugepage	huge page 비활성

1
# Scheme 추가 — cold page를 CXL.mem으로 demotion
2
$ cd /sys/kernel/mm/damon/admin/kdamonds/0/contexts/0/schemes
3
$ echo 1 > nr_schemes
4
$ cd 0/
5

6
$ echo migrate_cold > action
7
$ echo 2 > target_nid    # CXL node
8

9
# Access pattern — 10초 동안 1번 이하 access
10
$ echo 0 > access_pattern/min_nr_accesses
11
$ echo 1 > access_pattern/max_nr_accesses
12

13
# 영역 크기 — 1 MB 이상
14
$ echo 1048576 > access_pattern/min_sz
15
$ echo $((1024*1024*1024*1024)) > access_pattern/max_sz
16

17
# Watermark — 메모리 부족 시만 동작
18
$ echo 50 > watermarks/high
19
$ echo 30 > watermarks/mid
20
$ echo 10 > watermarks/low

#Tiered Memory Configuration

Linux의 memory tier 인터페이스:

1
# Tier 확인
2
$ ls /sys/devices/virtual/memory_tiering/
3
memory_tier0/  memory_tier1/
4

5
$ cat /sys/devices/virtual/memory_tiering/memory_tier0/nodelist
6
0,1        # DDR (hot tier)
7

8
$ cat /sys/devices/virtual/memory_tiering/memory_tier1/nodelist
9
2          # CXL.mem (cold tier)
10

11
# Tier ID 변경 (드물게 필요)
12
$ echo 100 > /sys/devices/virtual/memory_tiering/memory_tier0/tier_id
13

14
# 자동 promotion 활성
15
$ echo 2 > /proc/sys/kernel/numa_balancing   # NUMA balance + promotion
16
$ cat /sys/devices/system/node/node2/demotion_target_nodes
17
0,1        # CXL → DDR로 promotion 대상

#Promotion·Demotion 추적

실시간 모니터링:

1
# 1. DAMON 모니터링
2
$ damo monitor --kdamonds 0
3
[Sample]
4
Region 0-32M: 82% access, node 0
5
Region 32M-256M: 45% access, node 0
6
Region 256M-1G: 8% access, node 2
7
Region 1G-256G: 1% access, node 2
8

9
# 2. Migration 이벤트 트레이싱
10
$ cat /sys/kernel/debug/tracing/events/migrate/mm_migrate_pages/enable
11
1
12
$ cat /sys/kernel/debug/tracing/trace_pipe | grep migrate
13
   -<idle>...migrate_pages: nr_pages=128 from=node 2 to=node 0
14
   -<idle>...migrate_pages: nr_pages=64 from=node 0 to=node 2
15

16
# 3. perf로 migration 통계
17
$ perf stat -e migrate:mm_migrate_pages -a sleep 60
18
 Performance counter stats for 'system wide':
19

20
       123,456    migrate:mm_migrate_pages
21

22
      60.001 seconds time elapsed

#흔한 문제들

#False Promotion

Single-access page가 hot으로 잘못 분류:

1
[증상]
2
DAMON: Region X has 1 access in last 1 second
3
→ DAMOS migrate_hot triggered
4
→ Page promoted to DDR
5
→ Next 60 seconds: 0 access
6
→ Wasted DDR capacity

해결:

min_nr_accesses 임계 높임 (1 → 5+)
aggr_interval 늘림 (100ms → 500ms)

#Demotion Thrashing

같은 page가 DDR ↔ CXL 사이 왕복:

1
[증상]
2
Time 0:  Page X in DDR, access count high
3
Time 1:  Access 줄어듬 → demoted to CXL
4
Time 2:  Access 다시 발생 → promoted to DDR
5
Time 3:  Demoted again
6
... 반복

해결:

Migration cool-down 추가 (CXL → DDR 후 일정 시간 demotion 금지)
DAMOS의 quota 활성: 시간당 migration 횟수 제한
Terminal window
```
1
$ echo 100 > quotas/sz_permil  # 0.1% 메모리만 migrate
```

#Promotion 실패

DDR tier가 full일 때:

1
[증상]
2
[damon] migrate_hot scheme: 1024 pages
3
[mm] migrate_pages failed: -ENOMEM at node 0

해결:

DDR에 여유 확보 (vm.min_free_kbytes 증가)
동시 demotion 활성화 (damos demote-first flag)

#NUMA Balancing vs DAMON 충돌

1
[증상]
2
NUMA balance: promote page X to node 0 (CPU 0 access)
3
DAMON: page X is cold → demote to node 2
4
NUMA balance: page X access on CPU 0 → promote back
5
... 무한 충돌

해결:

NUMA balancing 비활성 (echo 0 > /proc/sys/kernel/numa_balancing)
또는 DAMON 비활성하고 NUMA balance만 사용

#워크로드별 권장 설정

워크로드	sample_interval	aggr	min_nr_accesses	quota
LLM inference	5ms	100ms	1	1%
In-memory DB	10ms	500ms	5	0.5%
Container host	50ms	1000ms	3	0.1%
HPC tight loop	(DAMON 안 씀)	—	—	—

HPC tight loop은 지연 민감이라 DAMON 자체 오버헤드도 부담. 다른 메커니즘 사용.

#bpftrace로 migration 캡처

깊은 추적:

1
$ bpftrace -e '
2
  tracepoint:migrate:mm_migrate_pages_start {
3
    @starts[args->from_node, args->to_node] = sum(args->nr_pages);
4
  }
5
  tracepoint:migrate:mm_migrate_pages_completed {
6
    @completes[args->from_node, args->to_node] = sum(args->nr_pages);
7
  }
8
  interval:s:60 {
9
    print(@starts);
10
    print(@completes);
11
    clear(@starts);
12
    clear(@completes);
13
  }
14
'
15

16
# 출력
17
@starts[0, 2]: 1234     # DDR → CXL demotion 시도
18
@starts[2, 0]: 567      # CXL → DDR promotion 시도
19
@completes[0, 2]: 1230  # 성공
20
@completes[2, 0]: 560   # 성공 (일부 실패)

#Performance Regression 사례

DAMON 활성화 후 throughput 떨어진 경우:

원인 추정:

sample_interval 너무 작음 — DAMON 오버헤드 큼
migration 자체 비용 — page migrate 시 수십 μs 정지
PTE Access bit 처리 — TLB flush가 자주 발생

해결 순서:

aggr_interval 증가 (100ms → 500ms)
quota 감소 (1% → 0.1%)
DAMOS scheme 비활성하고 모니터링만
그래도 문제 → DAMON 비활성

#자주 만나는 함정

증상	원인
DAMON 활성화했는데 access % 모두 0	`ops`가 잘못 — paddr인지 vaddr인지
Tier 정보 없음	HMAT 누락 — BIOS 확인
Migration이 안 일어남	watermark 임계 안 됨 — `watermarks/low` 확인
Migration 너무 많음	quota 미설정
CXL 노드 사용량 안 늘어남	numa_balancing이 promotion 우세 — DAMON quota 늘림
Workload throughput 떨어짐	sample_interval 작아서 오버헤드 — 늘림
`damo` 명령 안 보임	damo CLI 설치 안 됨 — `pip install damo`
Migration 후 SIGBUS	DAMON이 active page migrate 시도 — 매우 드문 race