Sanitizers · 4/5

TSan으로 데이터 레이스 디버깅 — Happens-before 추적

2026년 5월 29일 · Hawk · 6분 읽기

Sanitizer TSan ThreadSanitizer Concurrency DataRace C C++

#데이터 레이스가 왜 어려운가

1
int counter = 0;
2

3
std::thread t1([] { counter++; });
4
std::thread t2([] { counter++; });
5

6
t1.join(); t2.join();
7
std::cout << counter;   // 2 또는 1

counter++은 세 단계의 명령입니다: load → add → store. 두 스레드가 동시에 load를 하면, 둘 다 같은 옛 값을 보고 같은 새 값을 저장합니다. 결과는 2가 아니라 1.

이 버그가 어려운 이유는 대부분의 실행에서는 안 보입니다. 운 좋게 한 스레드가 다른 스레드보다 먼저 끝나면 정상으로 보입니다. 빌드를 100번 돌려도 한 번 터지지 않을 수 있습니다. 그러다 프로덕션 부하 상황에서 처음 드러납니다.

ThreadSanitizer(TSan)은 이런 잠재된 데이터 레이스를 실행 중에 감지합니다.

1
WARNING: ThreadSanitizer: data race (pid=12345)
2
  Write of size 4 at 0x7f8c1a000000 by thread T2:
3
    #0 increment_counter main.cc:5 (myapp+0x4012a3)
4
    #1 thread_runner main.cc:12 (myapp+0x4013e1)
5

6
  Previous write of size 4 at 0x7f8c1a000000 by thread T1:
7
    #0 increment_counter main.cc:5 (myapp+0x4012a3)
8

9
  Location is global 'counter' of size 4 at 0x7f8c1a000000 (myapp+...)

이 보고서가 해당 실행에서 레이스가 발생할 가능성이 있다는 의미입니다. 실제 잘못된 값을 보았는지와 무관하게, 충분히 빠른 스레드가 있다면 잘못될 수 있는 자리.

#TSan의 동작 — happens-before 추적

TSan은 각 메모리 접근에 대해 시간적 순서를 추적합니다. 두 스레드의 접근이 순서가 보장되지 않으면 레이스로 보고합니다.

순서가 보장되는 자리(happens-before)는 다음과 같습니다.

mutex 락: lock() → unlock() 사이의 코드는 다른 스레드의 동일 mutex lock() 이전에 happens.
atomic 연산: release store → acquire load가 happens-before를 형성.
스레드 생성: 부모 스레드가 자식 생성 호출 이전의 모든 일은 자식이 시작하기 이전에 happens.
스레드 join: 자식의 모든 일은 부모가 join() 이후에 happens.
condition variable: signal/wait 쌍이 happens-before를 형성.

이 명시적 동기화 없이 두 스레드가 같은 메모리에 접근하면 — 그것도 하나는 쓰기면 — 레이스입니다.

1
int data = 0;
2
std::atomic<bool> ready{false};
3

4
// 스레드 A
5
data = 42;                          // 쓰기
6
ready.store(true, std::memory_order_release);   // release store
7

8
// 스레드 B
9
if (ready.load(std::memory_order_acquire)) {    // acquire load
10
    int v = data;                   // 안전 — happens-after data=42
11
}

atomic store/load가 순서 다리를 놓아 줍니다. TSan은 이 다리를 이해하고, 위 코드를 레이스 없음으로 판정합니다.

#TSan 켜기

1
gcc -fsanitize=thread -fno-omit-frame-pointer -g -O1 main.c -o myapp
2
./myapp

ASan과 같이 못 씁니다. TSan은 별도 빌드를 만들어 따로 돌립니다.

1
option(ENABLE_TSAN "Enable ThreadSanitizer" OFF)
2

3
if(ENABLE_TSAN)
4
    add_compile_options(-fsanitize=thread -fno-omit-frame-pointer -g -O1)
5
    add_link_options(-fsanitize=thread)
6
endif()

1
cmake -B build-tsan -DENABLE_TSAN=ON
2
cmake --build build-tsan
3
ctest --test-dir build-tsan

#오버헤드

TSan은 Sanitizer 중 가장 무겁습니다.

실행 속도: 5~15× 느림
메모리: 5~10× 사용
컴파일 시간: 약 1.5× 느림

이 때문에 TSan은 PR 빌드에는 너무 무겁고, 보통 야간 빌드나 전용 작업에서 돌립니다.

#보고서 해석 — 실전 예시

1
std::map<int, int> cache;     // 동기화 없음
2

3
void worker(int key) {
4
    cache[key] = compute(key);
5
}
6

7
int main() {
8
    std::thread t1([] { worker(1); });
9
    std::thread t2([] { worker(2); });
10
    t1.join(); t2.join();
11
}

1
WARNING: ThreadSanitizer: data race (pid=12345)
2
  Write of size 8 at 0x7f8c... by thread T2:
3
    #0 std::_Rb_tree_insert in <header>
4
    #1 std::map::operator[] in <header>
5
    #2 worker main.cc:6
6
    #3 thread_runner main.cc:12
7

8
  Previous read of size 8 at 0x7f8c... by thread T1:
9
    #0 std::_Rb_tree_iterator in <header>
10
    #1 std::map::operator[] in <header>
11
    #2 worker main.cc:6
12
    #3 thread_runner main.cc:11
13

14
  Location is heap block of size 48 at 0x7f8c... allocated by main thread:
15
    #0 operator new in <libtsan>
16
    #1 std::map allocator main.cc:3
17
    #2 main main.cc:9

읽는 법:

Write와 Previous read가 같은 주소에서 일어남.
두 접근이 다른 스레드에서.
둘 사이에 동기화 없음.
Location: heap의 std::map 내부 노드. 두 스레드가 같은 map에 동시 접근.

해결: std::mutex를 추가하거나 std::shared_mutex + 읽기/쓰기 분리. STL 컨테이너는 기본적으로 스레드 안전 아님.

1
std::map<int, int> cache;
2
std::mutex cache_mutex;
3

4
void worker(int key) {
5
    std::lock_guard<std::mutex> lock(cache_mutex);
6
    cache[key] = compute(key);
7
}

#자주 만나는 false positive와 해결

TSan은 대체로 정확하지만, 몇 가지 패턴에서 false positive를 냅니다.

#1. 라이브러리가 TSan-instrumented가 아닐 때

TSan은 모든 코드가 계측되어 있다고 가정합니다. 외부 라이브러리(libc, libstdc++, OpenSSL)가 계측되지 않으면 그 안의 동기화를 TSan이 못 봅니다.

해결:

libstdc++/libc++: 보통 잘 동작. 안 되면 TSan-instrumented 빌드가 필요.
외부 C 라이브러리: suppression으로 해당 라이브러리 무시.

1
race:libcurl.so
2
race:OpenSSL_*

#2. atomic을 사용했는데 TSan이 false alarm

1
std::atomic<int> flag{0};
2
int data = 0;
3

4
// 스레드 A
5
data = 42;
6
flag.store(1, std::memory_order_relaxed);   // ❌ relaxed는 동기화 안 함
7

8
// 스레드 B
9
while (flag.load(std::memory_order_relaxed) == 0);   // ❌
10
int v = data;  // TSan: data race!

relaxed는 atomic 자체의 원자성만 보장하고, 주변 메모리의 happens-before 순서는 보장하지 않습니다. TSan은 정확히 이걸 잡습니다. 실제 동작이 우연히 올바르더라도 코드는 잘못된 것.

해결: release/acquire로 변경.

1
flag.store(1, std::memory_order_release);   // ✓
2
while (flag.load(std::memory_order_acquire) == 0);

#3. 시그널 핸들러 안의 접근

1
volatile int counter = 0;
2

3
void handler(int sig) {
4
    counter++;   // 시그널 핸들러
5
}
6

7
void worker() {
8
    counter++;   // 메인 스레드
9
}

시그널 핸들러는 동기화 없이 메인 스레드를 인터럽트합니다. TSan이 이 자리를 경고할 수 있습니다.

해결: std::atomic을 쓰고 핸들러 안에서는 async-signal-safe 한 연산만.

1
std::atomic<int> counter{0};
2

3
void handler(int sig) {
4
    counter.fetch_add(1, std::memory_order_relaxed);
5
}

#4. 락 외부의 읽기 전용 접근

1
struct Config {
2
    std::string name;       // 초기화 후 변경 안 함
3
    int max_users;
4
};
5

6
const Config g_config = load_config();
7

8
// 스레드 A, B, C 모두
9
std::cout << g_config.name;  // 동기화 없는 읽기

전역 const 객체를 초기화 후 읽기만 한다면 데이터 레이스가 아닙니다. 하지만 TSan은 초기화가 다른 스레드에서 일어났는지 확신할 수 없을 수 있어 경고할 수 있습니다.

해결: 초기화가 모든 스레드 시작 전에 끝남을 명확히 (main 함수 시작 부분, std::call_once).

#Suppression — TSan용

1
race:race_in_third_party_lib
2
deadlock:Foo::lock
3
mutex:libfoo.so

1
TSAN_OPTIONS=suppressions=tsan.supp ./myapp

TSan suppression은 여러 종류를 지원합니다.

키워드	무시 대상
`race:`	데이터 레이스
`race_top:`	스택 최상위가 매칭되는 레이스만
`thread:`	스레드 생성 누수
`mutex:`	mutex 관련 보고
`deadlock:`	데드락
`signal:`	시그널 핸들러 사용

race:libcurl.so는 어느 프레임이라도 libcurl이 끼면 무시, race_top:libcurl.so는 최상위 프레임이 libcurl일 때만 무시. 후자가 더 엄격합니다.

#TSan과 atomic memory model

TSan은 C++11 메모리 모델을 엄격히 따릅니다. 따라서 다음 코드들이 교과서적으로 어떻게 봐야 하는지를 가르쳐 줍니다.

#`relaxed` 단독은 데이터 보호 못 함

1
std::atomic<bool> flag{false};
2
int data;
3

4
// Producer
5
data = 42;
6
flag.store(true, std::memory_order_relaxed);
7

8
// Consumer
9
if (flag.load(std::memory_order_relaxed)) {
10
    int v = data;   // ❌ TSan 경고
11
}

relaxed는 해당 atomic 변수만 원자적입니다. 주변 메모리(data)의 가시성은 보장 안 합니다.

#`release/acquire`로 데이터 보호

1
std::atomic<bool> flag{false};
2
int data;
3

4
// Producer
5
data = 42;
6
flag.store(true, std::memory_order_release);
7

8
// Consumer
9
if (flag.load(std::memory_order_acquire)) {
10
    int v = data;   // ✓ data=42가 보임 보장
11
}

release-store와 acquire-load는 happens-before 다리를 놓습니다. Producer의 data=42가 Consumer에 정확히 전달됩니다.

#`seq_cst`는 기본값이자 가장 비싼 것

C++ atomic의 디폴트 메모리 순서는 seq_cst(sequentially consistent)입니다. 모든 스레드가 같은 순서로 모든 atomic 연산을 본다는 가장 강한 보장.

1
std::atomic<int> x;
2
x = 5;        // memory_order_seq_cst (기본)
3
int v = x;    // memory_order_seq_cst

성능을 정확히 측정하지 않았다면 seq_cst 디폴트가 안전. 명시적인 release/acquire나 relaxed로 약화하는 건 측정 + 정당화 후.

#데드락 검출

TSan은 데이터 레이스뿐 아니라 데드락도 감지합니다.

1
std::mutex m1, m2;
2

3
void thread_a() {
4
    std::lock_guard<std::mutex> g1(m1);
5
    std::lock_guard<std::mutex> g2(m2);   // m1 → m2 순서
6
}
7

8
void thread_b() {
9
    std::lock_guard<std::mutex> g2(m2);
10
    std::lock_guard<std::mutex> g1(m1);   // m2 → m1 순서 — 데드락 위험
11
}

TSan은 락 순서의 일관성을 추적해 역순이 가능한 자리를 경고합니다.

1
WARNING: ThreadSanitizer: lock-order-inversion (potential deadlock)

실제 데드락이 발생하지 않아도 보고합니다 — 가능성만으로도 위험.

해결: 모든 스레드에서 같은 순서로 락. C++17의 std::scoped_lock을 쓰면 자동 처리.

1
void thread_b() {
2
    std::scoped_lock g(m1, m2);   // 안전: 내부 알고리즘이 deadlock-free
3
}

#운영 팁

#작은 단위 테스트가 TSan에 적합

TSan은 느립니다. 큰 통합 테스트는 몇 분/몇 시간이 걸릴 수 있어 CI 부담이 큽니다. 다음을 권장:

동시성 관련 단위 테스트만 TSan으로 자주 돌림 (PR 빌드).
전체 테스트는 야간 빌드에 한 번 (성능 측정 안 되는 시간).
벤치마크 시나리오는 stress test 형태로 짧게.

#반복 실행으로 신뢰도 높이기

TSan은 실행 중에 발생할 가능성이 있는 레이스만 감지합니다. 한 번 실행으로는 모든 경로를 안 탑니다. CI에서 같은 테스트를 10번 반복하는 패턴이 흔합니다.

1
- name: TSan stress test
2
  run: |
3
    for i in {1..10}; do
4
      ./build-tsan/test || exit 1
5
    done

#thread sanitizer 친화적 라이브러리

일부 코드는 TSan과 안 친합니다.

메모리 풀: 동기화 없이 reuse하면 false positive 자주.
lock-free 큐: 정교한 atomic 사용을 TSan이 못 따라갈 수 있음.
fiber/coroutine: 사용자 모드 스케줄러는 TSan이 모름.

이런 자리는 suppress하거나, 알고리즘을 단순화하거나, TSan annotation (__tsan_acquire, __tsan_release)으로 직접 happens-before를 알려 줍니다.

#정리

TSan은 happens-before 모델로 데이터 레이스를 감지. 동기화 없이 같은 메모리 동시 접근이 레이스.
황금 옵션: -fsanitize=thread -fno-omit-frame-pointer -g -O1. ASan과 별도 빌드.
오버헤드 5~15×. 야간 빌드 또는 동시성 단위 테스트에 적합.
relaxed는 주변 메모리 보호 못 함. release/acquire 필요.
데드락도 감지 — lock-order-inversion 경고.
Suppression은 race: / mutex: / deadlock: 등 키워드별.
반복 실행 + 다양한 시나리오로 커버리지 확보.

#다음 장 예고

Ch 5: CMake / CI 통합에서는 지금까지 본 Sanitizer 빌드를 프로젝트에 자연스럽게 통합하는 방법을 다룹니다. CMake 옵션, sanitizer-friendly 라이브러리 모드, GitHub Actions / GitLab CI 설정 예시.

#참고 자료

ThreadSanitizer Manual (Clang)
TSan Flags
Memory Model Synchronization Modes
C++ Concurrency in Action (Anthony Williams) — 메모리 모델 깊이 이해

TSan으로 데이터 레이스 디버깅 — Happens-before 추적

#데이터 레이스가 왜 어려운가

#TSan의 동작 — happens-before 추적

#TSan 켜기

#오버헤드

#보고서 해석 — 실전 예시

#자주 만나는 false positive와 해결

#1. 라이브러리가 TSan-instrumented가 아닐 때

#2. atomic을 사용했는데 TSan이 false alarm

#3. 시그널 핸들러 안의 접근

#4. 락 외부의 읽기 전용 접근

#Suppression — TSan용

#TSan과 atomic memory model

#`relaxed` 단독은 데이터 보호 못 함

#`release/acquire`로 데이터 보호

#`seq_cst`는 기본값이자 가장 비싼 것

#데드락 검출

#운영 팁

#작은 단위 테스트가 TSan에 적합

#반복 실행으로 신뢰도 높이기

#thread sanitizer 친화적 라이브러리

#정리

#다음 장 예고

#참고 자료

Sanitizers · 4 of 5

관련 글

Sanitizer 종류 비교 — ASan·UBSan·LSan·TSan·MSan

LSan 누수 분석 — Stop-the-world Leak Detection 메커니즘

ASan과 UBSan 실전 설정 — 컴파일 옵션과 런타임 동작

이 글을 참조하는 글 (5)

#데이터 레이스가 왜 어려운가

#TSan의 동작 — happens-before 추적

#TSan 켜기

#오버헤드

#보고서 해석 — 실전 예시

#자주 만나는 false positive와 해결

#1. 라이브러리가 TSan-instrumented가 아닐 때

#2. atomic을 사용했는데 TSan이 false alarm

#3. 시그널 핸들러 안의 접근

#4. 락 외부의 읽기 전용 접근

#Suppression — TSan용

#TSan과 atomic memory model

#relaxed 단독은 데이터 보호 못 함

#release/acquire로 데이터 보호

#seq_cst는 기본값이자 가장 비싼 것

#데드락 검출

#운영 팁

#작은 단위 테스트가 TSan에 적합

#반복 실행으로 신뢰도 높이기

#thread sanitizer 친화적 라이브러리

#정리

#다음 장 예고

#참고 자료

Sanitizers · 4 of 5

관련 글

Sanitizer 종류 비교 — ASan·UBSan·LSan·TSan·MSan

LSan 누수 분석 — Stop-the-world Leak Detection 메커니즘

ASan과 UBSan 실전 설정 — 컴파일 옵션과 런타임 동작

이 글을 참조하는 글 (5)

#`relaxed` 단독은 데이터 보호 못 함

#`release/acquire`로 데이터 보호

#`seq_cst`는 기본값이자 가장 비싼 것