139
CHAPTER 5
인과관계 다이어그램을 통한 데이터 분석의 교란 해소
두 번째 영역에서 관심 변수 외에 데이터가 있는 유일한 변수는
SodaSales
입니다. 이 변수
는
IceCreamSales
나
BottledWaterSales
의 요인이 아니기 때문에
DCC
는 이 변수를 회
귀에 포함하지 않습니다. 그러나 데이터가 없는 (관찰되지 않은 )
AverageCustomerAge
와
CustomerHealthMindset
변수는 관심 변수의 요인이기 때문에 모두 회귀에 포함해야 합니
다. 이렇게 하면 반드시 교란이 생기는 것은 아니지만 교란이 생기지 않는다고 확신할 수도 없
습니다. 이것이
DCC
의 가장 큰 한계입니다. 관심 있는 변수의 일부 요인에 대한 데이터가 없
으면 도움이 되지 않습니다. 이제 백도어 기준으로 넘어가겠습니다.
5.3
백도어 기준
백도어 기준
backdoor
criterion
(
BC
)은 교란변수를 통제하는 대체 규칙으로 구성됩니다. 이 규칙은
분리 인과 기준과 매우 다른 트레이드오프가 있습니다. 이해하기 훨씬 더 복잡하고 완전히 정
확한 인과관계 다이어그램이 필요하지만 실제 교란변수에 초점을 맞추고 회귀에 중복된 변수
를 포함할 필요가 없습니다. 교란 해소의 정석은 이 규칙으로 식별한 변수를 통제하여 교란을
해소하는 것입니다. 이 방법은 교란 해소의 필요이자 충분 조건입니다.
5.3.1
정의
백도어 기준의 정의는 다음과 같습니다.
관심 요인으로 가는 화살표로 시작하는 차단되지 않은 비인과적 경로가 두 변수 사이에 하나 이상 ...