Python/Library

[Polars]폴라스 소개

C0de-Log 2025. 2. 14. 02:09

폴라스란?

폴라스는 판다스의 상위호환으로 대용량 데이터를 판다스보다 더 빠르고 쉽게 처리할 수 있다.

폴라스는 RUST언어를 기반으로 만들어졌으며 단일 스레드뿐 아니라 멀티 스레드 처리를 지원하여 보다 빠른 데이터 처리가 가능하다.

 

00강. [Pandas]판다스 소개

판다스란?넘파이와 같이 데이터 처리에 사용되는 파이썬의 라이브러리이다.판다스에서는 Series와 DataFrame이라는 테이블 형식의 객체를 제공하고 여러 데이터 처리 함수들을 제공해 데이터 처리

c0de-log.tistory.com

 

폴라스의 특징

1. 고성능

Rust 기반의 병렬 처리 엔진을 사용하여 데이터 연산 속도가 빠르다.

 

2. 표현식 기반 API

연산을 효율적으로 수행하기 위해 SQL과 유사한 표현식 기반 API를 제공한다.

 

3. 유연한 데이터 핸들링

CSV, JSON, Parquet 등의 다양한 데이터 형식을 지원한다.

 

사실 특징들이 판다스와 유사하여 대표적인 특성 세 가지만 적어보았다.

 

폴라스 설치와 Import

폴라스는 넘파이 판다스와 같은 라이브러리와 다르게 설치되어있지 않은 경우가 대부분이다.

그래서 보통 설치를 해야 사용을 할 수 있다.

# 폴라스 설치하기(설치되어 있지 않은 경우)
pip install polars

 

폴라스를 설치하였다면 이제 폴라스 라이브러리 불러와야 한다.

라이브러리를 불러오는 방법은 다음과 같다.

import polars as pl

 

결론

사실 판다스, 넘파이는 완벽하게는 아니지만 머신러닝을 하면서 자주 써본 경험이 있다.

하지만 폴라스는 처음이기도 하고 판다스의 단점을 보완한 라이브러리이므로 나중에는 판다스보다 더 많이 쓰일 수도 있을 것 같다.