판다스란?
넘파이와 같이 데이터 처리에 사용되는 파이썬의 라이브러리이다.
판다스에서는 Series와 DataFrame이라는 테이블 형식의 객체를 제공하고 여러 데이터 처리 함수들을 제공해 데이터 처리를 보다 빠르고 쉽게 할 수 있게 해 준다.
판다스의 특징
1. Series와 DataFrame객체
판다스에서는 Series(1차원)와 DataFrame(2차원)이라는 테이블 형식의 객체를 제공하여 데이터의 가독성을 높여주고 데이터 처리를 쉽게 만들어준다.
2. 데이터 처리 함수
결측치 처리, 데이터 필터링 등 데이터 처리에 사용하는 함수들을 제공하여 데이터 처리를 더 쉽게 만들어준다.
3. 여러 파일들과의 호환성
판다스 함수 중 외부 파일로부터 데이터를 불러올 수도 있으며 Excel, Json, CSV 등 다양한 파일을 지원한다.
데이터를 불러와 쉽게 읽고 쓸 수 있다.
4. 시계열 데이터 처리
시계열 데이터 처리와 관련된 다양한 함수들을 제공하여 시계열 데이터 처리를 쉽게 만들어준다.
판다스 설치와 import
판다스는 파이썬에 내장되어 있는 것이 아니라 외부에서 불러와야 한다.
어떤 프로그램을 사용하냐에 따라 판다스가 설치되어 있을 수도 있고 되어 있지 않을 수도 있는데 설치 방법부터 알아보자.
# 판다스 설치하기(설치되어 있지 않은 경우)
pip install pandas
판다스를 설치했거나 설치되어 있는 경우는 이제 판다스를 불러와줘야 한다.
import pandas as pd
결론
이번 글은 판다스의 사용보다는 판다스가 어떤 라이브러리인지 알아보는 시간이다.
지난 글에 설명했던 넘파이와 이번 글에 설명했던 판다스는 인공지능 부분에서 필수적으로 사용되니 인공지능을 배우고 싶은 분은 넘파이와 판다스는 꼭 알아야 한다.
'Python > Library' 카테고리의 다른 글
[Polars]폴라스 소개 (0) | 2025.02.14 |
---|---|
[Numpy] 넘파이 소개 (0) | 2025.02.03 |