본문 바로가기
반응형

인공지능9

[EDA] EDA에 대해, Titanic 데이터로 분석하기 EDA란? - 데이터 그 자체만으로 인사이트를 얻어내는 접근법(시각화) EDA의 Process 1. 분석의 목적과 변수(Column) 확인(명확하게) 2. 데이터를 전체적으로 살펴보기(데이터 간의 상관관계나 NULL값이 있는지 없는지 확인) 3. 데이터의 개별 속성 파악하기 Titanic Data를 통해서 분석하기 1. 목적 : 살아남은 살마들은 어떤 특징을 가지고 있었을까? titanic_df.dtypes titanic_df.describe() # 수치형 데이터만 보여줌 상관 계수 확인 titanic_df.corr() #Correlation is Not causation 상관성이 있다고 인과성이 있는 게 아니다! 결측치 확인 titanic_df.isnull().sum() 생존자수와 사망자수를 Barpl.. 2021. 8. 9.
[Flask] Flask 설치하기, 가상환경 시작 Mac pip3 install virtualenv virtualenv venv // 가상환경 만들기 source venv/bin/activate // 가상환경 진입 2021. 8. 9.
[Matplotlib] Seaborn 라이브러리로 그래프 그리기 Seaborn 라이브러리 -Matplotlib 기반으로 더 다양한 그래프 그리기 import seaborn as sns 커널 밀도 그림(Kernel Density Plot) - 히스토그램과 같은 연속적인 분포를 곡선으로 바꿔서 그린 그림 카운트 그림(Count plot) - count를 한 것을 그래프로 보여줌 - 범주형 column의 빈도수를 시각화 함 -> Groupby 후의 도수를 하는 것과 동일한 느낌 캣그림(Car Plot) - 더 복잡한 데이터를 다루는 데에 유리함(범주형이나 수치형 데이터에 좋음) - kind로 그림의 종류를 바꿔줄 수 있음 스트립 그림(Strip Plot) - scatter plot과 유사하게 데이터의 수치를 표현한 그래프 Swarm Plot - 데이터의 분산된 정도 및 중.. 2021. 8. 6.
[Matplotlib] 여러가지 그래프 그리기 산점도(Scatter Plot)로 그리기 꺾은선 그래프는 시계열 데이터에 많이 사용함 박스 그림(Box Plot, 수치형 데이터에 많이 사용) - 수치형 데이터에 대한 정보(Q1, Q2, Q3, min, max) 중간에 노란 선은 중간값을 의미함 막대 그래프 그리기(Bar Plot) - 범주형 데이터의 값과 값의 크기를 직사각형으로 나타낸 그림 히스토그램 그리기(막대그래프와 유사) - 도수분포를 직사각형의 막대 형태로 나타냄 !! 계급으로 나타내는 것이 특징(ex 0~2까지의 범주형 데이터로 구성 후에 그림을 그림) 원형 그래프 그리기(Pie Chart) - 데이터에서 전체에 대한 부분의 비율로 표현한 그래프 - 다른 그래프에 비해 비율 확인에 좋다 2021. 8. 6.
반응형