아는 만큼 보인다

2023 회고 - 1년 5개월 동안 데이터 어쩌구?로 살아남기 (2022년 회고를 곁들인..) 본문

기록/회고 혹은 일기

2023 회고 - 1년 5개월 동안 데이터 어쩌구?로 살아남기 (2022년 회고를 곁들인..)

계토 2023. 12. 12. 21:46

2022년을 건너뛰어 2023년 회고를 작성해야하는 시기가 오게 되었다. 무려 2022년 회고를 작성하겠다고 결심하고 1년이나 지난 셈이다 ^^. ;; 이번 회고는 더욱 진솔하게 써보고자 한다. 

2022 회고

2022년 상반기, 격동의 시기. 연구자에서 직장인(?)으로 진화하기 전...

2022년은 그야말로 격동의 시기였다. 2022년 1월 즈음, 심리학 박사과정을 하지 않기로 결심하고, 교수님과 기나긴 면담을 하고, 2022년 상반기까지는 연구실에 남아 연구를 마무리하기로 하고, 3월에 생애 첫 학회 포스터 발표를 위해 포르투갈도 다녀오고, 6월엔 투고도 하고, 6월 30일을 마지막으로 정 들었던(?) 연구실을 떠나 2022년 8월 현재 회사에 입사하고.... 매우 압축적이고 바쁘고 정신적으로도 힘든 한 해를 보냈던 것 같다. 또 더 없이 값진 학회 경험을 하기도 했고. 논문 마무리하면서 취업 준비를 했던 것도 정신 없었는데 그 와중에 감사하게 현 회사에 최종 오퍼를 받아 많이 쉬지는 못하고 입사를 했던 것 같다. 물론 빠른 취업을 할 수 있었음에 몹시 감사하고 그 덕분에 나의 정신 건강을 정말 많이 지킬 수 있었고 커리어를 더 빨리 시작할 수 있었지만... 요즘에서야 드는 생각은 취업 준비를 조금 더 해서, 공부를 더 많이 하고 기본기를 쌓았어야 했나라는 생각이 들 때도 있다(지금부터 열심히 하기로 다짐하며 극복).

 

연구실 생활 썰, 논문 썰을 풀면 사실 끝도 없이 할 수 있어서 (2박 3일 정도) 이만 줄여야할 듯 하다. 참고로 지난 달 애증의 first first-author paper가 최종 accept되어서~! 긴 연구 여정의 종지부를 진짜로(!!) 찍은 느낌이다. 가능하다면 논문 회고를 따로 작성할까 한다. 제목은....SCI급 논문 1저자가 되는 법? ㅋㅋㅋㅋ ㅜ 근데 실험부터 논문 출판까지 너무 3년(;;)이 걸려서... 제대로 회고할 수 있을지 ㅎㅎ

2022년 8월, 데이터 어쩌구로 입사하다!

현 회사에는 데이터 사이언티스트로 입사했다(고 생각하고 있다). 그러나 사실 정말 이것저것 많이 해서, 그냥 데이터 어쩌구로 일했다고 보는게 더 맞을 수도 있다. 2023 하반기로 오면서는 확실히 딥러닝 업무를 주요하게 하고 있지만, 입사 초기에는 데이터 분석이 필요한 모든 일을 담당했었다. 그리고 비교적 생소한 도메인으로 일을 시작하게 되어, 심전도에 대해서 공부하고 신호 처리에 대해서 공부하느라 시간을 보냈던 것 같기도 하다. 

 

2022년 하반기에 했던 일들 - 분석 한 스푼, 연구 한 스푼, 심전도 전처리 한 스푼

- 심전도, 신호 처리 관련 공부 / 심전도+딥러닝 논문 읽기

- 국내 대형 모 병원과의 연구 협력 지원(코드 리팩토링, 데이터 전처리, 모델 이것저것 돌려보기, 메인 저자분과 디스커션, 논문 editing)

- 호주 모 병원과의 연구 협력 지원(데이터 추출, 분석, 시각화, 논문 작성^^하지만 저자에는 못들어간..ㅜㅜ)

- beat detection 알고리즘 개선 프로젝트(벤치마크 테스팅, fp filtering 등)

- FDA 인증을 위한 프로젝트 시작....

- 기기 노이즈 분석 프로젝트 시작....

 

생각해보면 적응+공부+프로젝트 시작 일들이 많았어서 더욱 회고하기 어려웠던 것 같기도 하다. 저걸 4-5개월 동안 했으니.

 

그렇지만 오히려 내가 '잘할 수 있는 것'부터 시작해서 적응을 더 빨리 할 수 있었겠다는 생각이 새삼! 든다. 연구 지원을 하면서 데이터 통계 분석, 논문 writing 등 잘하는 것부터 하고, 또 그걸 하면서 이 분야(심전도, 심전도+머신러닝) 자체에 대해서 공부하기도 하고..회사 서비스나 DB에 대해서도 알아가고.... beat detection 알고리즘 개발할 때도, literature review 역량과 분석 역량을 발휘하면서 신호 처리에 대해 공부하고..... 상호작용하면서 성장할 수 있었던 것 같다. 회사에 당당하게 기여하면서 보람을 느끼기도 했고! literature review와 paper organizing, writing, editing은 정말 자신있었기 때문 ㅎㅎ (나 연구자 계속 했었어야 했나?ㅠ) 한편으로는, 입사 직후에는 분야에 대해 별로 아는 것도 없었을 텐데 논문 2편이나 지원을 했고 결국 2023년 둘다 accept되어 출판까지 기여할 수 있었다는 것이 뿌듯하기도 하다. 연구실에서 논문을 미친듯이 많이 빨리 와구와구 읽었던 게 도움이 되었나보다. 나의 적응력과 학습력! 자화자찬하는 시간을 가져야겠다~~ 

 

한가지 아쉬웠던 건, 모델 개발 업무를 본격적으로 할 수 없었다는 것인데, 사실상 2022년 하반기에는 회사 자체적으로도 모델 개발 업무를 활발하게 하지 않던 시기라서 어쩔 수 없었던 것 같다. 또, 이 시기에 심전도 분야에서 딥러닝 활용 방식? 전체적으로 이 도메인에서 뭐가 어떻게 돌아가는 건지 파악하기 위해 심전도+딥러닝 논문을 냅다 읽었었는데, 딥러닝 그 자체에 대한 공부도 병행했으면 더 좋았을 거라는 생각이 든다. 물론 이 때 냅다 읽은 논문들 덕분에 빠르게 적응할 수 있기도 했지만 말이다. 

 

그래도 요즘 이래 저래 자괴감이 들면서 나 뭐했지...라는 생각이 들었는데 입사하자마자 짧은 기간 동안 꽤 많은 일들을 했음을 다시 상기하니 다시 자신감이 생기기도 한다 ㅎㅎ 

2023년 회고

2023년에 했던 일들 - 분석 한 스푼, 모델링 한 스푼

- beat classification 모델 개발 프로젝트(완료)

- rhythm classification 모델 개발 프로젝트(완료)

- FDA 인증(device)을 위한 프로젝트(완료+승인됨!!!!!!!)

- 기기 노이즈 분석 프로젝트(완료?중단?)

- 딥러닝 모델 공부 + 블로그 더 열심히(진행중)

- FDA 인증(model)을 위한 프로젝트 시작(진행중)

- beat classification 모델 다시 개발(?) 프로젝트(진행중)

- 서비스 클러스터링 모델 개발 프로젝트(진행중, 부분적 참여)

 

음... 할 일을 나열하고 나서, 어떻게 회고를 시작해야 할지 감이 안와 한참을 멈춰있었던 것 같다. 우선 프로젝트 회고로 따로 다루지 않은 일부터 얘기를 해봐야겠다.

데이터 어쩌구로 활약하기

2022년 말부터 기기 FDA 인증을 위한 프로젝트가 시작되었고, 거기서 실험 데이터 분석을 맡게 되어 TF로 투입되었다. 실험 디자인부터 같이 참여해서 두 개의 실험, 분석, 문서 작성(!!!)까지 주도적으로 진행했다. 솔직히 정말 쉽지 않았다. 인증 프로세스는 한 번도 해보지 않았고... 분석을 어떻게 해야하고 어떻게 접근해야하는지 알고 있는 사람이 없어서 순전히 literature review와 FDA guideline에 의존하여 작업했다. 물론 인증 담당자분이 계셨지만 인증 전체를 관리하시는 분이고 구체적으로 분석에 관련해서는 스스로 진행해야 했다. 또한 분석 결과를 더 잘 전달해야할 필요성을 느껴서 FDA guideline에 맞춰 직접 문서 작성까지 해버렸다.. (원래는 인증 담당자분이 서류 작성) 다행인 점은 어쨌든 가이드라인에 맞춰서 작성을 하니 큰 문제 없이 지나가긴 했다는 점. 결국 승인이 되었고!!! 매우 뿌듯하고 기뻤다. 연구 지원하면서도 느끼고, FDA 문서 작성하면서도 느낀 건데 나 academic english writing 좋아하는 것 같아..(수줍)

 

기기 노이즈 분석 프로젝트 또한 2022년 말부터 시작되어 올해 상반기까지는 진행했는데, 결국은 노이즈 지표의 타당성을 제대로 확보하기 어려워서 중단된 프로젝트이다. 그럼에도 기본적인 EDA, linear mixed effect model 등 여러 통계적인 방법을 이용해서 나름 다각도로, 광범위하게 분석이 진행되었고 무려 직접 datamart를 꾸리고 docker로 metabase 기반 사내 dashboard를 구축하기도 했다(노이즈 지표 모니터링을 위해서!). 또 이사님들과 BD팀 앞에서 발표도 해보고. 그러나 마지막에 지표의 타당성에 대한 문제가 결국 해결되지 않아 일단 전면 중단된 프로젝트라 아쉬움이 남는다. Datamart도 더 개선하고, dashboard 작업도 더 확장하여 좋은 impact를 줄 수 있을 거라 생각했는데, 더 끌고 가지는 못했다. 2024년에 지표 개발부터 다시 하자는 이사님의 제안이 있었는데....이거는 나 혼자는 할 수 없는 일이라(^^) 좀 더 지원과 협력이 필요할 것 같다고 말씀드린 상태이다.

 

위의 일들이 모델링과 관련된 일이라기 보다는 좀 더 biostatistician? clinical scientist..? data analyst? 같은 일이었다. 그럼에도 데이터 어쩌구로서 배운 점은 정말 정말 많았다. 일단 두 프로젝트 모두에서 내가 써보지 못한 통계적인 방법을 써볼 수 있어서, 직접 통계 모델 공부해보고, 챙겨야 할 가정 챙겨보고, 논문들도 많이 읽어볼 수 있었다. 그리고 수업 시간에만 배운 모델도 써볼 수 있었고, 역시 언제나 그렇듯이 배우기만 한 모델과 써본 모델은 이해도가 다르다는 걸 알 수 있었다.

 

또 회사에 대해 더 많이 알아갈 수 있었다. 프로젝트를 하면서 사내 DB에 접근하고, 테이블 하나하나 뜯어보고, BD팀과 긴밀하게 협력하고 이사님들과 더 많이 소통하며 회사 서비스가 돌아가는 방식, 그 내부를 더 많이 알 수 있게 되었다. 오히려 이것저것 많이 해봐서 AI팀 내에서는 사내 DB나 서비스에 대해 내가 제일 잘 알고 있는 것 같다! 이러한 경험을 토대로 이후 사내 데이터 기반으로 학습 데이터셋을 구축해야 하는 업무도 내가 직접 주도할 수 있었고, 이후로도 내가 '담당자'가 되어 진행하고 있다.  아, 그 외에도, dashboard 작업을 하면서 DB에 추가적으로 수집해야 하는 데이터들이 몇개 있어 개발팀과 CTO에게 공유드린 적도 있다. 아쉬운건 아직 잘 안 되고 있다는 점.. 이 부분은 사실 데이터팀이 생겨서 사내 데이터를 더 조직적으로 관리해야겠다는 의지가 있어야 가능할 것 같기도 하다.

 

프로젝트라고 명명하진 않았지만 올해는 실제 심전도 데이터 판독 보조 작업도 병행했다. 말은 멋있어 보이지만 실제로는 데이터 라벨링 작업. 물론 심전도와 부정맥에 대한 이해가 있어야 한다는 점에서 일반적인 라벨링과는 다르지만.... 그냥 잡일이라고 생각하면 잡일이지만 그 과정에서도 배운게 정말 많다. 특히 리듬 분류 프로젝트 전에는 좀 더 주도적, 적극적으로 참여하여 많이 배웠던 것 같다. 우선, 판독사분들의 고충에 대해 이해하게 되었고, 어떤 부분에서 모델이 잘 못하는지, 어떤 부분에서 어떻게 잘못했을 때 사용자 입장에서 가장 어려운지 등을 알 수 있었다. 모델 개발할 때 많은 자양분이 되었고 이후에 판독사분들이랑 소통할 때에도 어떻게 질문해야 하는지 알고 있는 상태로 하니 더 효율적으로 진행할 수 있었다.

 

이거랑 관련해서 한 가지 자랑할 게 있는데, 판독 지원을 하면서 실제로 사용자 입장에서 있으면 좋겠다고 생각한 web 기능들을 따로 노션에 정리하여 사내에 공유드리기도 했다. 4가지 정도 개선 요구 사항, 이유, 기대 효과등을 간략하게 정리하여 공유를 드렸고, 실제 Product Owner 단계에서 검토 후 지금까지는 1개 실제 개선/배포 되었고 나머지도 백로그에 잘 올라가 있다 ㅎㅎ 이사님들도 매우 인상 깊고 감사하게 봤다고 말씀해주셨다. 회사 서비스와 상품에 대해 애정을 갖고 일해주어서 고맙다고....헤헤. 또한 내가 정리한 부분 중에 과거에 고객들이 한 번쯤 얘기했지만 우선 순위와 시급도에 밀려 잊혀진 기능도 있었어서 더욱 좋았다고 하셨다. 정말 시스템을 사용하면서 솔직하게 느낀 부분들을 공유드린 건데 생각했던 것보다 반응이 뜨거워서(?) 더욱 뿌듯했다. (- 진짜 솔직하게는 노션에 다 정리해놓고 너무 나대는 것처럼 보일까봐, 아니면 이상한 요구를 하는 걸까봐 하루 동안 망설이다가 공유를 드린거라 기분이 좋았고 용기를 얻었었다. 소심 성격을 극복한 사례 1로 남을 듯)

딥러닝 모델 개발자로 기여하기

그리고 위의 일들과 concurrent하게 진행된게 딥러닝 모델 개발 프로젝트! 

 

첫번째 프로젝트였던 beat classification 프로젝트에서는 솔직히 모델링 자체 측면에서는 많은 기여를 하지는 못했고, 데이터 정체, 모델 최적화, 훈련 방식 변화 등 모델 외적인 것과 관련된 일을 많이 했다. 또 데이터를 효율적으로 내리는 방법?에 대해서도 고민하고 공유하기도 했다 ㅎㅎ 당시에는 input 형태나 모델 구조에 대한 부분에서 의견이랄 것도 없고 소화하기 바빴어서 많은 논의를 함께하지 못한다는 사실이 힘들기도 했는데, 지금 돌이켜 생각해보면 그게 나의 '한계'였다기 보다는 경험이 부족하고 내 기준 사내 첫 모델링 프로젝트여서 그렇지 않았나 싶다. 그 이후로는 이렇게 하면 더 잘하지 않을까? 저렇게 했어야 하지 않을까?라는 생각을 많이 하기도 했다. 

 

두번째 rhythm classification 프로젝트.. POC 과정에서는 팀원들 다 같이 진행했지만, 그 이후로는 스스로 주도했던 감명깊었던 (ㅎㅎ) 프로젝트. input에 대해 정말 많이 고민했고, 퍼포먼스 최적화 부분에서도 정말 많이 고민했었다. 처음부터 끝까지 진행해봤다는 점에서 많이 배웠고, 스스로 dataset 만들고 dataloader 구축하고 모델 구축/테스트 해보면서 이 때 비로소 모델링에 대한 눈이 뜨였던(?) 것 같다. 지금 돌이켜보면 더 개선할 수 있는 부분들이 많다. 시간적인 이유, 리소스적인 이유로 더 많이 시도해보지 못한 것도 많고. 추후 리듬 모델 개발 프로젝트에서는 더 잘할 수 있을 것 같아 ~! 

 

현재는 beat classification 모델 다시 개발 프로젝트(?)를 진행하고 있고, 이것도 10월 경부터 주도적으로 맡아서 1월 배포를 목표로 달리고 있다. 두 번의 프로젝트 경험도 쌓이고 보고 들은 것도 많아져서 이번에는 더 많은 모델을 시도해보기도 하고, dataloader 최적화 방법도 많이 시도하고, 하이퍼파라미터 튜닝도 더 다각도로 진행해보려 하고 있다. 우여곡절이 없었던 건 아니지만 점점 나아지고 있는 것 같고, 중간 단계이지만 성능은 이전 모델보다 확실히 좋아서 자신이 있다. 요 프로젝트 끝나고도 회고를 작성해야 하는데 할 말이 몹시 많을 듯. 특히 리듬에 비해 10배 많은 데이터로 학습을 하면서 여러 어려움이 있었고 그래서 데이터 로더 최적화 관점에서 많이 성장할 수 있었다. 아, 또한 첫번째 beat classification 프로젝트에서 내가 제기했던 'undersampling'문제를 해결하기 위해 좀 더 이것저것 실험해보기도 했고! 

1년 5개월 동안 이룩한 성장

  • 통계: 다양한 통계적 기법들(bland-altman plot, linear mixed effect model 등)을 적용해보면서 역량을 확장해볼 수 있었다. 심리학 연구를 하면서 결국 쓰던 것만 쓰는 경향이 있었는데, 분야를 틀면서 새로 해보게 된 것들이 많다.
  • 머신러닝/딥러닝 모델링: 대학원 다니면서 머신러닝/딥러닝 수업 듣고 과제를 해본게 솔직히 내 경험의 전부였다. 회사에서 실무 프로젝트를 하며, 모델 구축 역량, 학습 그 자체, 최적화, 데이터로더 구축 등등 전 과정을 직접 해보면서 딥러닝에 대해 더 많이 알게되었다. 특히 하반기에는 더 많은 모델을 적용해보기 위해 computer vision쪽 공부를 더 열심히 하고자 했고 눈에 익은 모델들이 늘어나기 시작했다. imbalance에 대해서도 고민 많이 하고 리소스 아껴쓰기라든지.... 텐서플로우 이해....등등..... 끝도 없다.
  • 심전도+딥러닝 연구에 대한 이해: 처음에는 introduction, method에서 턱턱 막히고 리뷰 논문에서는 길을 잃기 쉽상이었는데 그래도 요즘은 intro 정도는 휙휙 넘어가고 result와 discussion을 보며 비판적인 사고를 어느 정도 할 수 있게 된 것 같다. 그리고 심전도 자체와 부정맥 자체에 대해서도 정말 많이 배워서 이제 웬만한 쉬운 case는 스스로 판독할 수 있다. self-판독 가능
  • 신호 처리: 이 부분은 성장이 조금 더딘 파트이다. 우선 너무 문외한이기도 했고, 요즘 추세가 딥러닝을 적극적으로 활용하면서 minimally processing하는 추세이기도 해서 더 그런 듯하다. 
  • Pandas, numpy, python: 대학원 때보다 더 heavy하게 사용하기도 하고, 엔지니어링 쪽에도 조금 걸쳐가며 일하다보니 좀 더 잘 쓰는 방법(?)에 대해 알아가고 있다. 특히 numpy로 최적화해서 속도가 빨라졌을 때의 그 쾌감은 아직 잊을 수 없다.
  • 리소스 아껴쓰는 방법: 메모리 안 터지게 일하기, gpu 메모리 잘 나눠쓰고 아껴쓰기, core 수 잘 조절하기, multi-processing 조심해서 쓰기 등등... 
    • 아니 솔직히 cpu로 딥러닝 모델 추론해야하는 환경...으로 못하는게 많고... 하지만 덕분에 모델 더 가볍게하고 코드 더 최적화하기 등을 배울 수 있고...하지만 gpu 쓰고 싶고..... 그렇다
    • 그리고 모델 돌리는 사람 4명인데 48G gpu 2장으로 메모리 알뜰하게 나눠써야 하고 ram은 256G라서 몹!시! 알뜰하게 나눠써야할 뿐 아니라 OOM으로 docker 계속 죽고..... 그래서 절약 정신을 배웠지만!!! ram 조금만 더 많았으면 좋겠고 그렇다. ㅋㅋ 회사가 더 성장해서 돈이 많아져서 리소스도 풍부해졌으면 좋겠다. 
    • 그렇지만 리소스를 탓하지 않고 야생에서 잡초처럼 성장하고야 말겠다.
  • 이런 저런 개발 관련: datamart, dashboard  구축하면서도 많이 공부하고, multi-processing 쓰면서도,,, 배포할 때 성능 측정하면서도,,,훈련할 때 docker 사용하면서도,,,, 이것저것 많이 배웠다(더 배움이 필요함).
  • 사내 API 스터디 진행..? - 무려 API 스터디를 진행했고 간단한 블로그를 위한 백엔드 구현 스터디를 함께했었다. API가 뭔지도 모르는 (ㅜㅜ) 사람으로... 직접 구현해보면서 감을 많이 잡을 수 있었던 것 같다. 
  • 기술 이외의 부분: 현재 팀과 소통하는 방법, 적극적으로 의견 제시하는 방법, 다른 분야의 사람들과 소통하고 협력하는 방법, 회사 비즈니스 로직 이해....등등등
  • 빠르게 1인분을 하게 되었다고 생각한다. 그리고 적어도 1인분은 하게 되었다고 생각한다. 아직 '등을 맡길 수 있는 동료'가 되었다는 말을 하기에는 조금 자신 없지만 그래도 스스로 분류 프로젝트도 맡고, 그 동안 다른 팀원들은 플랫폼 구축, 클러스터링 연구, 다른 모델 연구 등의 일도 하고... 잘 자리잡아 가고 있는 것 같다.
  • 아, 영어!!!!!: 영어 말하기/듣기가 꽤 늘었다. 해외 병원/회사와 협력하는 일이 정말 많고, 특히 지금 팀에 인도네시아에서 온 데이터 엔지니어 분이 계셔서 영어를 '매일 써야만 하는' 상황이었다. 그 덕분인지, 문법적 완성도와 상관 없이 이제 툭 치면 영어가 나오는 수준이 되었고 회사에서도 영어 잘한다고 칭찬도 많이 받고, 인도 회사랑 미팅할 때도 찰떡같이 알아 듣고 대답하고 칭찬받고~~ 회의에서는 내가 통역비슷한거도 하고.... 역시 언어는 많이 써야 성장한다! 미래 글로벌 인재(ㅎㅎ)로서 좋은 성장이었다.
  • 또 뭐가 있지? 

1년 5개월 동안 잘했다고 생각하는 부분

회사와 서비스에 대한 애정을 갖고 닥치는 대로 일했고, 그 결과 서비스에 대해 더 잘 알게 되기도 하고 모델링 업무를 할 때도 더 효율적인 방식으로 접근할 수 있었다. 예를 들어, clustering metric을 고민할 때에도, 서비스 관점에서, clustering 결과를 사용자가 어떻게 쓰는지 많이 알아본 결과 단순 distance가 아니라 서비스에 좀 더 맞는 metric을 고안해서, 하나 추가할 수 있었다. 판독 지원 경험이나 다른 분석 경험이 서비스에 대한 이해도도 높여주고, 학습 셋을 만들고 모델 최적화를 할 때에도 도움을 주었다.

 

항상 주도적으로 일하고, 의견을 적극적으로 제시하고자 했다. input을 이렇게 해보면 어떨지, undersampling 방법을 바꿔보는 건 어떨지, 데이터를 내리는 방법을 바꿔보는 건 어떨지.... 다 받아들여졌던 것은 아니지만 항상 적극적으로 의견을 제시하고 토론을 이끌어냈다. 그 중에는 실제로 반영되어서 성능이 높아진 경우도 있고, 새로운 agenda가 생기기도 했다. 대시보드를 만들어 일을 더 편하게 할 수 있게 하는 부분도, 시켜서 했다기 보다는 어떻게 하면 모두가 더 잘 할 수 있을까 고민한 끝에 나온 결정이기도 했다. 그러기에 더욱 open source로 알아보기도 했고. 또한 모델링이나 다른 일을 하다가 어려운 일이 있으면 적극적으로 알리고 의견을 얻고자 했다. 종종 시간에 쫓기거나, 상황 상 그렇지 못한 경우도 물론 있었지만, 앞으로는 더 적극적으로 의견을 묻고 제시하고 토론하고자 한다. 

 

쨌든 내가 맡은 프로젝트에 대해서는 책임감을 갖고 일을 했고, 끝까지 했다. 리듬 분류 모델을 개발하며 모델 성능 개선 자체로는 한계를 느껴 후처리를 고안할 때에도, 스스로 후처리에 대한 필요성을 느껴 약 한 달 간 끈질기게 매달렸다. 그 결과 어느 정도 말이 되는 결과를 이끌어낼 수 있었고, 부정맥 리듬에 대한 이해도도 높아졌던 것 같다. FDA 인증 분석 과정에서도 여러 우여곡절이 많아서, 할 수 있을까?라는 의문이 많이 들 때도 있었지만 결국 포기하지 않고 끝까지 '완성'을 해냈었다. 지금도 비트 분류 모델 같은 경우도 어떻게든 더 stable하고 안정적인 지표를 뽑아내는 모델을 만들고자 많이 공부하며 개선해나가고 있다. deadline이 눈 앞에 있는 경우가 아니라면 '이 정도면 됐다'라는 생각은 하지 않으려 하고, 더 좋은 결과를 만들고자 노력하고 있다.

 

이런 태도로, 배우려는 태도로 계속 일하고 있고, 모르는 것이 있으면 배워서 하고, 이게 맞는지 다시 점검하고, 가능한 선에서 best practice로 일하려고 노력하며 그래도 1년 5개월간 빠르게 성장할 수 있었던 것 같다. 

올해 아쉬웠던 점, 그리고 2024년에 나에게 기대하는 바

나름대로는 최선을 다 하고 살았지만, 그럼에도 아쉬움이 남는 부분이 더 많다.

1. 더 깊이 일하고 공부하지 못한 점.

회사에서 닥치는 대로 일을 하면서 배운 점도 많긴 했으나, 어떤 부분에서는 '아 더 깊이 공부하고 파고 들어가볼 걸...'이라는 생각이 들 때도 있다. 심전도 전처리 고민할 때 신호 처리를 더 많이 꼼꼼히 공부했으면 더 좋았겠다는 아쉬움이 남는다. 심전도와 부정맥에 대해서는 많이 알게 되었지만 아직 signal 자체에 대해서는 공부할 것들이 더 많다. 또, 모델을 적용할 때에도, 왜 이 모델이 잘 작동하는지, 왜 모델링이 잘 안되는지 why에 대한 질문을 더 많이 던져봤어야 했다. 모르겠으면 더 찾아보고, 나만의 이유도 생각해보고.... 프로세스가 느리면 왜 느리고 어디서 병목이 더 많이 생기는지... 이런 부분들. 마지막으로, 스치며 본 것들을 스쳐지나가지 말고 더 뜯어볼 걸... 개발을 하다보면 정보의 홍수에서 필요한 내용을 선별하는 것이 중요하다. 그러나 그 과정에서 스쳐지나가며 본 것 중 모르는 것을 더 뜯어보고, 더 제대로 취사 선택을 했으면 좋았을 것 같다. 마음이 조급해서 그냥 넘어갔던 부분들도 분명히 있는데(특히 개발 관련), 그런 부분에서 깊이를 더했어야 했었다... 

 

사실 입사 직후 성과나 프로젝트에 대한 조급함도 있었고, 모델링 같은 업무는 손에 익지 않은(?) 업무이기도 해서 더 그랬던 것 같다. 요즘은 적응도 하고 일이 손에 붙어서 다시 복습하는 시간을 갖고 있는데 더 많이 성장하는 느낌이라 더 아쉬움이 남는 것 같다. 이 기세를 몰아 2024년에도 가능하면 이것저것 깊이 있게 공부하고, 깊이 있게 고민하는 시간을 많이 가지려고 노력할 것이다.

2. 더 많이? 공부하지 못한 것.. 코딩도 모델링도 통계도

더 깊이 공부하지 못한 것도 아쉽지만, 공부도 더 이것저것 많이 하지 못한게 아쉽다. 파이썬 책도 사놓고 거의 못 읽었고, 통계학 책 복습도 많이 진행하지 못했다. 그나마 모델링은 좀 복습을 하긴 했지만.,., 

 

결국 이 분야에서 잘 살아남으려면 기술적인 기초를 잘 닦아야 한다. 결국 테그 직군에 계속 있으려면 이러한 기초를 탄탄하게 해야하고, 그렇지 않으면 나의 약점이 되어 부메랑처럼 날아온다. 쌓인 업보들이 한번에 들이닥치는? ㅎㅎ .. 또 확장적(?)으로 일하려면 중요하기도 하고. 결국 다 일 잘하자고 하는 일.

 

CS 공부도, 통계 공부도, 머신러닝/딥러닝 공부도 2024년에는 더 제대로 할 수 있길... 지금 생각하는 건, 우선 파이썬+알고리즘 책 다 공부하기, 통계 교과서 복습하기, 머신러닝 수업 때 썼던 교과서 복습하기, 딥러닝 모델 차곡차곡 읽기. 최신 논문도 어떻게는 follow-up하기. 그렇지만 기본을 놓치지 말기!  '뭐든 알고 쓰자' 정신으로 집요하게 공부하기.

 

올해 공부 시간 확보를 충분히 하지 못한 점들이 조금 아쉽다. 그래도 2022년 하반기 2023년 상반기까지는 논문 리비전+재투고 일정도 있어서 체력과 혼(?)이 빨려나가는 시간이 있었지만 이제는 그런 일들이 없으니 더 안정적으로 공부시간을 확보할 수 있을 것 같다(제발!). 회사에서 혼을 다해서 일하고 나면 저녁에 공부하기가 정말 쉽지 않은데, 체력을 기르기 위해 운동도 좀 더 열심히 꾸준히 해야겠다. 회사에서도 틈만나면 공부하기! @ ! 

3. 더 잘 기록하지 못한 점

여러 업무를 하며 배운 기술들이 정말 많고, 블로그 글 to-do list도 정말 많은데 다 기록하지 못했다. TO-DO 카드들만 계속 쌓여가고 있다. 더 많이 기록해서 뼈에 새기자. 미완성일지라도 남기고, 조금씩 완성해나가자.

4. 깎아나가고 싶은 내 방망이(강점) 찾고 뚝딱뚝딱 깎기

데이터 어쩌구로서 험난한 업계에서 살아남으려면 나는 무얼 깎아나가야 할까? 기술적 관점에서 내가 가질 수 있는 딴딴한 방망이는 뭐가 있을까. 물론 흘러가는 대로 사는 것도 나쁘지 않고, 그러면서 배우는 것이 있고, 또 계획대로만 삶이 살아지지는 않는다는 것도 알고 있지만, 어떠한 전략으로 survive하고, 더 '잘' survive할 수 있을지 좀 더 고민할 수 있는 2024년이 되길 바란다. 물론 1, 2번 공부하기를 충실하게 한다는 전제 하에 ㅎㅎ 

 

 

할 말이 많아서 너무 길어졌다 ㅜㅜ