Data & Analytics
14 posts in this category

데이터 품질 체크 자동화: NULL, 중복, 일관성 검증 SQL 템플릿
데이터 품질 이슈를 사전에 잡는 SQL 체크리스트. NULL, 중복, 참조 무결성, 범위 검증.

이상치 탐지를 SQL로: Z-Score와 IQR 기반 아웃라이어 찾기
비정상 데이터를 SQL로 자동 탐지. Z-Score, IQR, 백분위 기반 이상치 탐지 구현.

시계열 분석 SQL: 이동평균, YoY, MoM 트렌드 완전 정복
매출 트렌드가 보이지 않는다면? 이동평균, 전년비, 전월비를 SQL로 구현하는 법.

A/B 테스트 결과 분석을 SQL로: 통계적 유의성 직접 계산하기
외부 툴 없이 SQL만으로 A/B 테스트 결과 분석. Z-검정, 신뢰구간, 샘플 사이즈 계산.

퍼널 분석 심화: 전환율과 이탈 지점을 SQL로 찾는 법
어디서 사용자가 이탈하는지 SQL로 정확히 파악하기. 단계별 전환율 계산의 모든 것.

코호트 분석 SQL로 직접 구현하기: 리텐션의 모든 것
GA4 없이도 코호트 분석 가능합니다. 가입월별 리텐션, N일 리텐션 SQL로 직접 구현.

CTE 완전 정복: 서브쿼리 지옥에서 벗어나는 법
WITH 절 하나로 복잡한 쿼리가 읽기 쉬워진다. 재귀 CTE로 계층 구조도 한 방에.

GA4 없이 마케팅 퍼널 직접 만들기 — 세션/어트리뷰션/ROAS SQL 구현
비싼 분석 도구 없이 SQL만으로 세션, 어트리뷰션, 퍼널, ROAS를 직접 구현하는 방법을 다룹니다.

"이건 Python으로 해야 해요" — SQL로 Pivot, JSON, UTM, RFM 전부 끝내기
Python 스크립트 100줄 대신 SQL 한 줄로 Pivot, JSON 파싱, UTM 추출, RFM 세그먼테이션을 처리하는 실전 패턴을 다룹니다.

BPE vs Byte-level Tokenization: 한글은 왜 영어보다 API 요금이 2-3배 비쌀까?
똑같은 내용인데 한글은 영어보다 토큰이 2-3배 더 나옵니다. BPE 토큰화의 영어 중심 학습이 만든 구조적 불평등, 그리고 한글 사용자가 알아야 할 현실적 대응 방법을 설명합니다.

RAG 시스템의 진짜 병목: 벡터 DB가 아니라 원본 데이터의 1:N 관계입니다
RAG 정확도 문제를 벡터 DB 튜닝으로 해결하려는 팀이 많습니다. 하지만 실제 병목은 원본 데이터의 관계형 구조를 무시한 Chunking에서 발생합니다.

"이거 SQL로 되나요?" — Window 함수로 서브쿼리 지옥 탈출하기
LAG, LEAD, RANK로 전월 대비, 순위, 누적 합계를 깔끔하게 계산하는 법

JOIN 하나 잘못 쓰면 매출이 2배로 잡힌다 — 중복 없는 매출 집계의 모든 것
1:N JOIN에서 Row Explosion이 발생하는 원인과 정확한 매출 집계 방법

왜 당신의 SQL 쿼리는 10분이 걸릴까? — EXPLAIN QUERY PLAN부터 인덱스 설계까지
EXPLAIN, 인덱스, WHERE vs HAVING — 쿼리가 느린 이유를 직접 진단하고 최적화하는 법