본문 바로가기
goodLuck
Data/재밋는 데이터 분석

2단계 세부 콘텐츠 선별, 데이터 전처리, 데이터 분석, 미드저니

by snowballing 2023. 8. 29.

(많은 데이터를 찾은 후, 다음 단계)

다양한 데이터를 찾았고 그 다음 한번 더 필요한 데이터가 무엇이고 불필요한 것은 어떤 건지 선별 작업이 필요했다. 

선별 작업하기 이전에 아래처럼 주제를 좀 더 구체화 시켰고 필요한 데이터와 정책이 뭔지 요약을 진행. 

my노션_요약정리

이때 정말 회사 다니면서 준비했었는 데, 점심시간, 퇴근시간에 과제 준비한다고 진짜로 힘들었다. 정말 ㅋㅋㅋ 자격심사에서 떨어지면 안해야지~ 했는 데, 통과하고 나서도 이걸 해말아 엄청 고민이 있었다. 

 

'영고나' 였다. 그때 스터디 팀내 동료가 나를 부르던 별명.

영원히 고통받는 나딘(내 닉네임)

 

하지만 돌아보니, 참여해서 진행하길 잘했다고 생각한다. 얻은 것이 많아서. 

 

(다시 돌아와서 그 다음 데이터 분석은 어떻게 시작했나)

코랩으로 데이터 분석을 진행했고, 이 과정 속에서 데이터 전처리에 상당한 시간이 소요됬다.....! 

 

예로 아래는 아파트 관련 데이터인데, 위도경도에 대한 데이터가 없는 경우에는 주소 데이터를 이용해서 위경도를 추출해주는 작업이 필요했고, 주소가 불필요하게 상세한 경우에는 사용하기 쉽게 재정리가 필요했다. 

코랩_주소 데이터 기준으로 위경도 추가한 화면

어떤 결과가 나와야 된다는 것이 분명해졌을 때는 아래와 같이 코드로 정보를 요약하거나 도표를 시각화하는 작업은 비교적 수월했다. 특히 gpt 도움을 많이 받기도 했고. 이때 정말로 데이터 분석의 본질이란 무엇인지 체감했다고 생각한다. 이에 대한 이야기는 나중에. 

데이터 분석_일부 코드
데이터 분석_일부 코드

전체 데이터 분석 코드는 깃에 올려는 놨음.

https://github.com/seonghyeonOrNot/EV_charge_location/blob/main/%EC%A0%84%EA%B8%B0%EC%B0%A8_%EC%9D%B8%ED%94%84%EB%9D%BC_%EB%B6%84%EC%84%9D.ipynb

 

 

(ppt 자료 만들기)

데이터 분석을 어느정도 마무리 한 이후에는 ppt 자료를 만들면서 디자인을 진행했다. 필요하나 사진들은 미드저니를 이용해서 추출.

미드저니로 다양한 실험
최종 픽스한 대표 이미지

미드저니에서 추출한 사진으로 ppt를 만드니까 뭔가 그럴듯한 퀄리티가 나와서 만족했다. 앞으로도 계속 실험해서 좋은 퀄리티의 이미지를 써 볼 생각. 

댓글