박정민

mail github github blog linkedin

명확한 목표를 세우고 목표에 알맞은 결과를 내고자 노력합니다.
사람과 정보를 중요하게 생각하여, 적극적인 소통을 추구합니다.
ML/DL을 공부하여 AI 시스템으로 현실의 문제를 해결하고자 합니다.

학력

서울대학교 컴퓨터공학부, 2021. 03 - 2027. 02 (예정)

4학년 재학
전체 평점 3.84 / 4.3, 전공 평점 3.92 / 4.3 (수강 학점: 98)

프로젝트 경험

‘자연언어처리 개론’ 과목 프로젝트 (KorEduBench)

2025.10 - 2025.12

📎 Github 📎 Post 📎 PPT

[문제 상황]

한국 공교육 도메인 텍스트를 교육과정 성취기준 코드로 분류하는 벤치마크 설계
성취기준 수가 많아 LLM 단독 분류의 비용과 정확도 한계가 존재

[진행 사항]

AI Hub 교과 데이터를 정제하며 오라벨과 클래스 불균형 문제를 점검하고 벤치마크 데이터셋 구성
RoBERTa-large 기반 top-k classifier를 구축해 관련 성취기준 후보를 우선 검색하는 2-step 파이프라인 설계
LLM 모델(Llama, Qwen, gpt)과 모델의 크기, few-shot 설정을 바꾸어가며 교육 도메인 분류 성능과 효율성을 분석
4인 팀의 팀장으로서, 마일스톤, 실험설계, LLM baseline 코드 작성과 역할분담 등을 수행.

‘딥러닝의 기초’ 과목 프로젝트 (ARC-AGI Challenge)

2025.05 – 2025.06

📎 Report

[문제 상황]

ARC-AGI 데이터셋에 대한 모델 추론 정확도 향상
제한된 GPU 및 추론 시간 제약(100분) 하에서 효율적 추론 수행

[진행 사항]

Qwen3-0.6B를 base 모델로 선정하고, full fine-tuning 중심의 학습 전략 비교·실험 수행
2-stage training pipeline 설계: 원본 데이터 학습 후, flip/rotation, digit shuffle 기반 데이터 증강을 추가하여 일반화 성능 개선
추론 파이프라인 고도화: rank-based task filtering, task-specific test-time training (TTT), confidence-based Best-of-N sampling을 결합하여 정답 선택 성능 향상
베이스 모델군, 모델 크기, fine-tuning 방식(Full FT vs QLoRA), 데이터 다양성에 따른 성능을 비교 분석
Notion 기반 협업 환경 구축, 데이터 증강 및 테스트 결과 시각화 코드 구현, 실험 및 결과 분석 역할 수행

2024 SNU FastMRI Challenge

2024.06 - 2024.08

📎 Github 📎 발표 영상

[문제 상황]

가속 촬영된 MRI 뇌 이미지를 고화질로 복원
GPU 메모리(16GB) 및 추론 시간 제약
제한된 데이터 양으로 인한 학습 효율 문제

[진행 사항]

MRI Reconstruction SOTA 모델인 E2E VarNet을 기반으로 실험 설계
k-space / image 도메인 증강 병행으로 데이터 부족 문제 해결
- 기존 k-space 증강 기법에 밝기, 대비, mask augmentation 추가
- CutMixUp 기법으로 이미지 데이터 다양성 확보
모델 규모 확장 대신 dataset 분석 및 효율적인 전/후처리에 집중
WandB / Notion을 활용한 실험 관리 및 팀 협업 체계 구축

[결과]

전체 4위 수상
Public dataset 기준 SSIM 0.9803 달성

수상내역

2024.09, SNU FastMRI Challenge, 4위, 서울대학교
2025.02, STX 장학재단 장학생, 2025년 장학생 선발 (총 11명), STX 장학재단
2025.02, 운해재단 장학생, 2025년 12기 운해장학생 선발, 운해재단

기타 활동

2025 SNU FastMRI Challenge 총괄 조교

2025.05 - 2025.09

대회 규정 설정 및 280여명의 참가자 관리
Vessl AI 및 공과대학 정보화지원실과 협업하여 k8s 기반 GPU 컨테이너 관리
참가자 권한과 실행 환경을 사전 점검하고, 오류 상황별 대응 가이드를 정리해 운영 리스크를 최소화
기존 brain image dataset에 knee image를 추가하여 대회 주제의 범용성을 높임
데이터 전처리, baseline 코드, 운영 기준을 명확히 문서화하여 반복 문의와 시행착오를 줄이고 원활한 대회 진행에 기여
Github issues를 통해 대회 관련 질의응답을 수시로 진행

서울대학교 Holi Lab 학부연구인턴

2025.08 - 2026.03

서울대학교 조요한 교수 지도하에 학부연구인턴으로 활동
SLM Agent 연구를 수행하며 AI Agent의 벤치마크와 시스템에 대한 이해를 심화 (논문리뷰)

‘컴퓨팅 기초’ 학부생 조교

2024.03 - 2024.06, 2024.09 - 2024.12

2024학년도 1학기 및 2학기 ‘컴퓨팅 기초’ 과목의 조교로 활동
Python, 웹 크롤링, 데이터 분석 관련 실습과 프로젝트를 지원하며 학습 보조 및 질의응답 담당

서울대학교 딥러닝 학회 Deepest

2026.03 - 현재

Rookie 트랙 참여 (딥러닝 스터디 진행)

서울대학교 중앙동아리 러닝크루 달리샤

2024.03 - 2025.02

주 1회 교내 운동장 정기 러닝에 참여
사이버 영토 수호 마라톤 대회 10km (50:58 완주) 참가

기술 스택

프로그래밍

Python C/C++

ML/DL

Pytorch Huggingface