본문 바로가기

국비과정/Vue

20230918 _[76일차]_01. Pandas 사용해보기

[Pandas] 판다스 기초 자료형 (DataFrame, Series) 및 관련 코드 (tistory.com)

 

 

[Pandas] 판다스 기초 자료형 (DataFrame, Series) 및 관련 코드

Pandas 기본 개념 Pandas에서 Series는 하나의 column이나 row, DataFrame은 여러 series의 collection(엑셀 sheet, 파이썬 dictionary)이라고 생각하면 된다. 그리고 DataFrame에서 axis=0은 열 방향, axis=1은 행 방향이다.

bioinfoblog.tistory.com

 

pandas 사용해보자

pycharm을 켜서 pandas 설치해준다.

Alt+F12 로 터미널 실행 후 pip install pandas 입력

아래처럼 다운로드가 되면 설치완료

 

[ sep18_01 파일생성 ]

 

상단에 import 해주면 사용가능 _ import pandas as pd

'

출력해보면 아래의 형식으로 출력된다.

 


* Series :  1차원 데이터 배열. 단일 열(컬럼)의 데이터를 저장하는 데 사용, 값(value)과 인덱스(index)로 구성

 

* DataFrame : 2차원 데이터 테이블로, 행(row)과 열(column)로 구성.

이는 관계형 데이터베이스나 엑셀 스프레드시트와 유사한 형태를 가지며, 여러 열의 데이터를 저장하고 다룰 때 주로 사용

(여러 개의 Series로 구성된 것으로 생각할 수 있으며, 각 열은 Series로 간주됨)


 

[ sep18_02 파일생성 ]

출력해보면 아래의 정돈된 형태로 출력된다.

 

 

index와 columns를 바꿔보면 에러가 난다.


drop으로 데이터를 제외해보자.

axis=0 : 각 열의 모든 행에 대해서 동작

axis=1 : 각 행의 모든 열에 대해서 동작

pandas inplace true :  변경사항을 저장할지에 대한 여부

pandas inplace true 를 빼고 출력해보면 아래처럼 변경사항 적용이 안된 채로 출력된다.


[ sep18_03 파일생성 ]

 

파일 하나 다운로드 받고 해당파일의 경로를 넣어 파일을 읽어보자.

경로 =>  C:\Users\user\Downloads

 

읽어낸걸 data에 저장하고 이걸 출력해본다.

 

오류나는데 다시 파일경로를  / 로 바꿔주니 잘 나온다.

 

data.shape 으로 출력해보면 아래처럼 나온다.

 

 

파일을 읽어올때는 read , 저장할때는 to 

아래처럼 하면 지정해준 경로에 python1이라는 csv파일이 저장된다.


[ sep18_04 파일생성 ]

다시 새로운 데이터 만들어준다.


 

[Pandas] loc[ ] 로 행, 열 조회하기 : 네이버 블로그 (naver.com)

 

[Pandas] loc[ ] 로 행, 열 조회하기

Pandas(판다스, 팬더스) Dataframe(2차원, 행열)에서 loc를 이용해서 행 또는 열의 데이터를 조회하는 방...

blog.naver.com


 

loc [ ] 로 원하는 행과 열을 조회해보자.

 

'서준' : '우현'   =>  '서준' ~ '우현' 까지 열의 순서에 따라 가져옴

 

boolean 형태로 적어주면 True에 해당하는 index의 데이터들만 가져온다. 

 

배열형태가 아니면 아래처럼 출력된다.

 

 


[ 상관계수관련 ]

 

[기초통계] 상관계수란? What is correlation coefficient? (tistory.com)

 

[기초통계] 상관계수란? What is correlation coefficient?

상관계수란? 이전 포스팅에서 두 연속형 변수의 관계를 눈으로 확인하기 위한 산점도에 대해 알아보았다.산점도로부터 파악할 수 있는 관계는 객관성이 부족한 면이 있다. 예를 들어 동일한 크

leedakyeong.tistory.com

 

15-05 상관계수 (corr / corrwith) - [Python 완전정복 시리즈] 2편 : Pandas DataFrame 완전정복 (wikidocs.net)

 

15-05 상관계수 (corr / corrwith)

####DataFrame.corr(method='pearson', min_periods=1) ####DataFrame.corrwith(other, axis=0, drop=Fals…

wikidocs.net