(많은 데이터를 찾은 후, 다음 단계)
다양한 데이터를 찾았고 그 다음 한번 더 필요한 데이터가 무엇이고 불필요한 것은 어떤 건지 선별 작업이 필요했다.
선별 작업하기 이전에 아래처럼 주제를 좀 더 구체화 시켰고 필요한 데이터와 정책이 뭔지 요약을 진행.
이때 정말 회사 다니면서 준비했었는 데, 점심시간, 퇴근시간에 과제 준비한다고 진짜로 힘들었다. 정말 ㅋㅋㅋ 자격심사에서 떨어지면 안해야지~ 했는 데, 통과하고 나서도 이걸 해말아 엄청 고민이 있었다.
'영고나' 였다. 그때 스터디 팀내 동료가 나를 부르던 별명.
영원히 고통받는 나딘(내 닉네임)
하지만 돌아보니, 참여해서 진행하길 잘했다고 생각한다. 얻은 것이 많아서.
(다시 돌아와서 그 다음 데이터 분석은 어떻게 시작했나)
코랩으로 데이터 분석을 진행했고, 이 과정 속에서 데이터 전처리에 상당한 시간이 소요됬다.....!
예로 아래는 아파트 관련 데이터인데, 위도경도에 대한 데이터가 없는 경우에는 주소 데이터를 이용해서 위경도를 추출해주는 작업이 필요했고, 주소가 불필요하게 상세한 경우에는 사용하기 쉽게 재정리가 필요했다.
어떤 결과가 나와야 된다는 것이 분명해졌을 때는 아래와 같이 코드로 정보를 요약하거나 도표를 시각화하는 작업은 비교적 수월했다. 특히 gpt 도움을 많이 받기도 했고. 이때 정말로 데이터 분석의 본질이란 무엇인지 체감했다고 생각한다. 이에 대한 이야기는 나중에.
전체 데이터 분석 코드는 깃에 올려는 놨음.
(ppt 자료 만들기)
데이터 분석을 어느정도 마무리 한 이후에는 ppt 자료를 만들면서 디자인을 진행했다. 필요하나 사진들은 미드저니를 이용해서 추출.
미드저니에서 추출한 사진으로 ppt를 만드니까 뭔가 그럴듯한 퀄리티가 나와서 만족했다. 앞으로도 계속 실험해서 좋은 퀄리티의 이미지를 써 볼 생각.
'Data > 재밋는 데이터 분석' 카테고리의 다른 글
에코프로 머터리얼즈의 경쟁력 (0) | 2023.09.13 |
---|---|
스타벅스 개인 컵 사용량 데이터 분석 (0) | 2023.08.31 |
1단계_전기차 충전을 위한 인프라 분석_상세 계획 수립 (0) | 2023.08.29 |
데이터활용 실무경험 (0) | 2022.11.08 |
댓글