본문 바로가기
생활 관련 정보

파이썬 업무 자동화 프로그램 만들기! (웹크롤링) feat. 구글Colab

by InfoSniper 2025. 3. 18.
반응형

구글 Colab을 활용한 파이썬 업무 자동화 프로그램 만들기

1. 서론: 구글 Colab과 파이썬으로 업무 자동화하기

현대 업무 환경에서는 반복적인 작업이 많아 효율성을 높이는 것이 중요하다. 특히 데이터 처리, 보고서 작성, 이메일 자동화와 같은 작업들은 수작업으로 하면 많은 시간이 소요된다. 이를 해결하기 위해 파이썬(Python)을 활용한 업무 자동화가 점점 더 중요해지고 있다.

하지만 많은 사람들이 업무 자동화 프로그램을 만들 때 환경 설정, 코드 실행, 데이터 저장 등의 문제로 어려움을 겪는다. 이때, 구글 Colab(Google Colaboratory)을 활용하면 별도의 환경 설정 없이 쉽게 파이썬을 실행하고 업무 자동화 프로그램을 개발할 수 있다.

이번 글에서는 구글 Colab에서 업무 자동화 프로그램을 만드는 방법을 예제와 함께 상세히 설명한다. Colab을 활용하면 무료로 클라우드 환경에서 파이썬 코드를 실행할 수 있으며, 데이터 분석, 웹 크롤링, 이메일 자동화, 엑셀 데이터 처리 등의 작업을 쉽게 수행할 수 있다.


2. 구글 Colab이란?

✅ 구글 Colab의 특징

구글 Colab(Colaboratory)은 구글에서 제공하는 클라우드 기반의 파이썬 실행 환경으로, 머신러닝, 데이터 분석, 업무 자동화 등을 쉽게 수행할 수 있다.

설치 필요 없음 → 웹 브라우저에서 실행 가능
무료 사용 가능 → 기본적인 CPU 및 GPU 지원
Google Drive 연동 → 파일 저장 및 로딩이 용이
공유 기능 제공 → 협업이 쉬움

Colab을 사용하면 별도의 소프트웨어 설치 없이 빠르게 업무 자동화 프로그램을 만들 수 있다.

 

 

https://jjucoworld.tistory.com/entry/googleColab

 

구글 Colab 완벽 가이드: 정의, 특징, 사용법 및 설정 방법

1. 서론: 구글 Colab이란?최근 데이터 분석, 인공지능(AI), 머신러닝, 웹 크롤링, 자동화 등의 분야에서 파이썬(Python)을 활용한 프로그래밍이 점점 더 중요해지고 있습니다. 하지만 파이썬을 사용하

jjucoworld.tistory.com

 


3. 구글 Colab에서 업무 자동화 프로그램 만들기

이제 실전 예제를 통해 Colab을 활용하여 업무 자동화 프로그램을 만들어보자. 여기서는 엑셀 데이터 처리, 웹 크롤링, 이메일 자동화 등을 단계별로 설명한다.

예제 1: 엑셀 데이터 자동 처리 (pandas 활용)

엑셀 데이터를 다루는 작업은 많은 업무에서 필수적이다. Colab에서 pandas 라이브러리를 활용하면 엑셀 파일을 쉽게 불러오고 처리할 수 있다.

📌 1) Colab에서 엑셀 파일 읽기

우선, Google Drive에 저장된 엑셀 파일을 Colab에서 불러와보자.

from google.colab import drive  
import pandas as pd  

# 구글 드라이브 마운트  
drive.mount('/content/drive')  

# 엑셀 파일 경로 설정  
file_path = "/content/drive/My Drive/data.xlsx"  

# 엑셀 파일 불러오기  
df = pd.read_excel(file_path)  

# 데이터 확인  
df.head()

📌 2) 데이터 자동 수정 및 저장

불러온 데이터를 자동으로 수정하고 다시 저장하는 코드다.

# 특정 컬럼 데이터 변경  
df['판매가'] = df['판매가'] * 1.1  # 가격 10% 인상  

# 변경된 데이터 저장  
df.to_excel("/content/drive/My Drive/data_modified.xlsx", index=False)  

print("파일 저장 완료!")

이제 데이터를 자동으로 수정하고 저장할 수 있다.


예제 2: 웹 크롤링을 이용한 데이터 수집 (BeautifulSoup 활용)

웹에서 데이터를 자동으로 수집하는 크롤링도 업무 자동화에 유용하다. 예를 들어, 특정 웹사이트에서 최신 뉴스 제목을 가져와보자.

📌 1) 필요한 라이브러리 설치

Colab에서는 추가 라이브러리를 설치할 수도 있다.

!pip install beautifulsoup4 requests  

📌 2) 웹사이트에서 데이터 가져오기

import requests  
from bs4 import BeautifulSoup  

# 크롤링할 웹사이트 URL  
url = "https://news.google.com/"  

# 웹 페이지 요청  
response = requests.get(url)  

# HTML 파싱  
soup = BeautifulSoup(response.text, 'html.parser')  

# 뉴스 제목 가져오기  
titles = soup.find_all('a', class_="DY5T1d")  

# 출력  
for title in titles[:10]:  
    print(title.text)

이제 Colab에서 웹 데이터를 자동으로 수집할 수 있다.


예제 3: 이메일 자동 발송 (smtplib 활용)

업무에서 이메일을 반복적으로 보내야 하는 경우가 많다. 이를 자동화하면 시간을 절약할 수 있다.

📌 1) 이메일 자동 발송 코드

import smtplib  
from email.mime.text import MIMEText  

# 이메일 설정  
sender = "your_email@gmail.com"  
receiver = "recipient@example.com"  
password = "your_password"  

# 이메일 내용  
msg = MIMEText("안녕하세요, 이 메일은 자동으로 발송된 메일입니다.")  
msg['Subject'] = "자동화된 이메일 발송 테스트"  
msg['From'] = sender  
msg['To'] = receiver  

# SMTP 서버 연결  
server = smtplib.SMTP_SSL("smtp.gmail.com", 465)  
server.login(sender, password)  
server.sendmail(sender, receiver, msg.as_string())  
server.quit()  

print("이메일 발송 완료!")

📢 주의: Gmail의 경우, 앱 비밀번호를 설정해야 SMTP 사용이 가능하다.


4. Colab을 활용한 업무 자동화의 장점

설치 필요 없음 → 웹에서 바로 실행 가능
클라우드 환경 지원 → 어디서나 접근 가능
다양한 라이브러리 사용 가능 → pandas, BeautifulSoup, smtplib 등 지원
협업 용이 → Colab 노트북을 공유하여 팀원과 함께 작업 가능

Colab을 활용하면 엑셀 데이터 처리, 웹 크롤링, 이메일 자동 발송 등 다양한 업무를 쉽게 자동화할 수 있다.


5. 결론: 구글 Colab으로 업무 자동화 시작하기

구글 Colab은 환경 설정이 필요 없고, 무료로 사용할 수 있어 업무 자동화에 최적화된 도구다.
이번 글에서 소개한 엑셀 데이터 처리, 웹 크롤링, 이메일 자동 발송 외에도, 다양한 업무를 자동화할 수 있다.

업무 효율성을 높이고 싶다면, 구글 Colab과 파이썬을 활용한 자동화 프로그램을 직접 만들어보자! 🚀

반응형