본문 바로가기

전체 글26

[논문 앞부분 읽기] Expl(AI)n It to Me – Explainable AI and Information Systems Research 지난 15년간 AI에서 엄청난 발전이 있었는데, object recognition, NLP, recommendation system, digital assistant 등이 있다. 예측 성능은 매우 놀랍지만, 왜 그러한 결과를 가져오게 되었는지 인간이 이해할 수 있는 수준에서 설명을 할 수 있을만한 transparency나 interpretability에서는 다소 부족하다. 방법론적 관점에서는 다음과 같은 문제가 발생한다. 1) 예측 결과에 대해 설명, 감시가 불가능한다면 예측결과가 초래할 수 있는 의도치 않은 결과에 대해 책임을 어떻게 질 수 있는가. 2) AI를 사용하는 목적을 단순히 예측 결과를 알아내는 것에 그쳐서는 안된다. Machine learning이 결과를 도출해내는 과정을 배우고 해석하여,.. 2021. 8. 24.
Longitudinal Data Analysis - GEE Stutdy Design 및 장단점 한 id 당 관측값이 1개인 cross-sectional data와 다르게 longitudinal data는 한 id 당 관측값이 여러개 일 수 있다. 그리고 prospective이 될 수도, retrospective이 될 수도 있다. 개인별 변화를 볼 수도 있고, 그룹 내 변화를 볼 수도 있다. 하지만, 복잡하고 시간이 지날수록 missing data나 늘어날 수 있다는 단점이 있다. 오랜시간 관측하기 때문에 비용이 많이 들수도 있다. 비교 임상시험은 cross-sectional한 구조를 가지고 있다. 예를 들어 survival analysis를 할 때는 여러 관측값보다는, event까지 걸린 시간을 측정을 한다. multiple correlated survival .. 2021. 8. 17.
08. [STATA] for statement 한꺼번에 확인하기 많은 변수를 다룰 때는 for문이 매우 편리하게 쓰인다. 예를 들어 다음과 같은 구문을 사용해야 한다고 한다면, mean weight if rep78==1 mean weight if rep78==2 mean weight if rep78==3 다음과 같이 간단하게 만들 수 있다. i 대신에 var을 써도 되고, 원하는 이름을 선택하면 된다. foreach i in 1 2 3{ mean weight if rep78==`i' } 이런식으로 값을 바꾸는 곳에 활용할 수도 있고, 아래와 같이 여러 변수를 조회할 때도 사용할 수 있다. foreach var in foreign rep78 make{ tab `var' } 2021. 8. 17.
07. [STATA] 기초 통계 chi-squared, t-test 예시를 위해 auto 데이터를 사용하였다. sysuse auto 그리고, 새로운 categorical 변수를 생성하였다. (04번 글 참고) gen mpg2 = 1 if mpg >= 20 replace mpg2=0 if mpg2 == . br tab mpg2 label define mpg2 0 mpg_under_20 1 mpg_over_20 label value mpg2 mpg2 . tab mpg2 mpg2 | Freq. Percent Cum. -------------+----------------------------------- mpg_under_20 | 35 47.30 47.30 mpg_over_20 | 39 52.70 100.00 -------------+-----------------------.. 2021. 8. 6.