goodLuck Data16 2단계 세부 콘텐츠 선별, 데이터 전처리, 데이터 분석, 미드저니 (많은 데이터를 찾은 후, 다음 단계) 다양한 데이터를 찾았고 그 다음 한번 더 필요한 데이터가 무엇이고 불필요한 것은 어떤 건지 선별 작업이 필요했다. 선별 작업하기 이전에 아래처럼 주제를 좀 더 구체화 시켰고 필요한 데이터와 정책이 뭔지 요약을 진행. 이때 정말 회사 다니면서 준비했었는 데, 점심시간, 퇴근시간에 과제 준비한다고 진짜로 힘들었다. 정말 ㅋㅋㅋ 자격심사에서 떨어지면 안해야지~ 했는 데, 통과하고 나서도 이걸 해말아 엄청 고민이 있었다. '영고나' 였다. 그때 스터디 팀내 동료가 나를 부르던 별명. 영원히 고통받는 나딘(내 닉네임) 하지만 돌아보니, 참여해서 진행하길 잘했다고 생각한다. 얻은 것이 많아서. (다시 돌아와서 그 다음 데이터 분석은 어떻게 시작했나) 코랩으로 데이터 분석을 진.. 2023. 8. 29. 1단계_전기차 충전을 위한 인프라 분석_상세 계획 수립 '전차기 충전을 위한 충전기 설치수 예측' (참여이유) 데이터를 다루고 싶은 데, 계속 페이크 데이터로만 분석하다보니, 실제 데이터로 의미있는 인사이트를 도출해내고 싶은 마음이 굴뚝같았다. 그러던 중, 우연히 데이터 분석 대회가 있다는 것을 알 게 되었고 주제도 본인이 설정할 수 있어서 관심가는 주제로 결정. 자격심사가 한달넘게 걸린 것 같다. 그에 반해 발표 준비기간은 1주일. 시간이 얼마 없었다! (어떤 부분을 과제로 삼았나?) 여러 카테고리에서 나는 '에너지 부분> 전기차' 와 관련된 것으로 가닥을 잡았고, 최종적으로 '전기차 대중화로 인한 충전기 수량 예측'이라는 주제로 발표 자료를 만들었다. (어떤 과정로 진행했나?) 아래처럼 단계별로 진행 : 페이지 정의 -> 데이터 리서치 -> 데이터 전처리.. 2023. 8. 29. 파이썬) 배열에서 리스트로 변환해서 사용하는 이유 리스트(list)는 파이썬에서 가장 기본적이고 많이 사용되는 데이터 타입 중 하나입니다. 리스트는 여러 값을 하나의 변수에 저장할 수 있고, 추가, 삭제, 수정, 검색 등 다양한 연산을 지원합니다. (아래 코드 참고) def item_code_by_item_name(item_name): item_code_list = df_krx.loc[df_krx["Name"] == item_name, "Symbol"].tolist() if len(item_code_list) > 0: item_code = item_code_list[0] return item_code else: return False Pandas DataFrame은 열(column)과 행(row)으로 이루어진 2차원의 데이터 구조를 갖습니다. DataF.. 2023. 4. 25. SQL) SELECT에서 쓴 alias는 왜 WHERE절에 못 쓸까? 그 이유는 바로 대부분의 SQL 데이터베이스에서 SELECT 절은 FROM 절 뒤와 WHERE 절 앞에서 처리된다. 즉, SELECT 절에 정의된 열 별칭은 WHERE 절이 처리될 때 아직 사용할 수 없음. SQL 엔진의 프로세스 FROM -> JOIN -> WHERE -> GROUP BY -> HAVING -> SELECT -> ORDER BY -> LIMIT 위 순서대로 흘러가기 때문에 SELECT 문에서 쓴 alias는 WHERE절에서 인식할 수 없어서 오류가 나는 것이다. 좀 더 설명하자면, FROM 절: SQL 엔진은 먼저 쿼리의 FROM 절을 사용하여 데이터를 검색할 테이블 식별 JOIN 절: If 쿼리에 JOIN 절이 포함되어 있으면 SQL 엔진은 지정된 조인 조건을 사용하여 지정된 테이블 .. 2023. 2. 20. ERD 란 ?? ERD: Entity-Relationship Diagram 데이터베이스의 엔터티 간 관계를 그래픽으로 표현한 것. ERD는 일반적으로 데이터베이스 설계 및 모델링에서 시스템의 서로 다른 엔터티 간의 관계를 시각화하는 데 사용한다. ERD는 엔터티, 특성 및 관계로 구성 엔터티는 사람, 장소 또는 사물과 같은 실제 개체를 의미 속성은 사람의 이름이나 주소와 같은 엔터티의 특성 또는 속성 관계는 사람이 그룹의 구성원이거나 고객이 주문하는 것과 같이 엔터티 간의 연결 또는 연결을 설명함 ERD의 기본 구성 요소 엔티티: 내부에 엔티티 이름이 있는 직사각형으로 표시 속성: 내부에 속성 이름이 있는 타원 또는 타원으로 표시되며, 해당 엔티티에 선으로 연결 관계: 다이아몬드로 표현되며 두 개체를 연결하고 이들 간의.. 2023. 2. 20. 머신러닝을 위한 수학능력 요건 선형대수학 (Linear Algebra): 나의 동료중 한 명인 Skyler Speakman은 최근에 “선형대수학은 21세기의 수학이다"라고 말한적이 있는데 나는 이 말에 전적으로 동의한다. 머신러닝에서 선형대수학은 모든 곳에서 나타난다. 주성분 분석 (Principal Component Analysis, PCA) 단일값 분해 (Singular Value Decomposition, SVD) 행렬의 고유분해 (Eigendecomposition of a matrix) LU 분해 (LU Decomposition) QR 분해 (QR Decomposition/Factorization) 대칭 행렬 (Symmetric Matrices) 고유값 & 고유벡터 (Eigenvalues & Eigenvectors) 벡터 공간.. 2023. 2. 19. 이전 1 2 3 다음