박정민
mail github github blog linkedin
- 명확한 목표를 세우고 목표에 알맞은 결과를 내고자 노력합니다.
- 사람과 정보를 중요하게 생각하여, 적극적인 소통을 추구합니다.
- ML/DL을 공부하여 AI 시스템으로 현실의 문제를 해결하고자 합니다.
학력
서울대학교 컴퓨터공학부, 2021. 03 - 2027. 02 (예정)
- 4학년 재학
- 전체 평점 3.84 / 4.3, 전공 평점 3.92 / 4.3 (수강 학점: 98)
프로젝트 경험
‘자연언어처리 개론’ 과목 프로젝트 (KorEduBench)
2025.10 - 2025.12
[문제 상황]
- 한국 공교육 도메인 텍스트를 교육과정 성취기준 코드로 분류하는 벤치마크 설계
- 성취기준 수가 많아 LLM 단독 분류의 비용과 정확도 한계가 존재
[진행 사항]
- AI Hub 교과 데이터를 정제하며 오라벨과 클래스 불균형 문제를 점검하고 벤치마크 데이터셋 구성
- RoBERTa-large 기반 top-k classifier를 구축해 관련 성취기준 후보를 우선 검색하는 2-step 파이프라인 설계
- LLM 모델(Llama, Qwen, gpt)과 모델의 크기, few-shot 설정을 바꾸어가며 교육 도메인 분류 성능과 효율성을 분석
- 4인 팀의 팀장으로서, 마일스톤, 실험설계, LLM baseline 코드 작성과 역할분담 등을 수행.
‘딥러닝의 기초’ 과목 프로젝트 (ARC-AGI Challenge)
2025.05 – 2025.06
[문제 상황]
- ARC-AGI 데이터셋에 대한 모델 추론 정확도 향상
- 제한된 GPU 및 추론 시간 제약(100분) 하에서 효율적 추론 수행
[진행 사항]
- Qwen3-0.6B를 base 모델로 선정하고, full fine-tuning 중심의 학습 전략 비교·실험 수행
- 2-stage training pipeline 설계: 원본 데이터 학습 후, flip/rotation, digit shuffle 기반 데이터 증강을 추가하여 일반화 성능 개선
- 추론 파이프라인 고도화: rank-based task filtering, task-specific test-time training (TTT), confidence-based Best-of-N sampling을 결합하여 정답 선택 성능 향상
- 베이스 모델군, 모델 크기, fine-tuning 방식(Full FT vs QLoRA), 데이터 다양성에 따른 성능을 비교 분석
- Notion 기반 협업 환경 구축, 데이터 증강 및 테스트 결과 시각화 코드 구현, 실험 및 결과 분석 역할 수행
2024 SNU FastMRI Challenge
2024.06 - 2024.08
[문제 상황]
- 가속 촬영된 MRI 뇌 이미지를 고화질로 복원
- GPU 메모리(16GB) 및 추론 시간 제약
- 제한된 데이터 양으로 인한 학습 효율 문제
[진행 사항]
- MRI Reconstruction SOTA 모델인 E2E VarNet을 기반으로 실험 설계
- k-space / image 도메인 증강 병행으로 데이터 부족 문제 해결
- 모델 규모 확장 대신 dataset 분석 및 효율적인 전/후처리에 집중
- WandB / Notion을 활용한 실험 관리 및 팀 협업 체계 구축
[결과]
- 전체 4위 수상
- Public dataset 기준 SSIM 0.9803 달성
수상내역
- 2024.09, SNU FastMRI Challenge, 4위, 서울대학교
- 2025.02, STX 장학재단 장학생, 2025년 장학생 선발 (총 11명), STX 장학재단
- 2025.02, 운해재단 장학생, 2025년 12기 운해장학생 선발, 운해재단
기타 활동
2025.05 - 2025.09
- 대회 규정 설정 및 280여명의 참가자 관리
- Vessl AI 및 공과대학 정보화지원실과 협업하여 k8s 기반 GPU 컨테이너 관리
- 참가자 권한과 실행 환경을 사전 점검하고, 오류 상황별 대응 가이드를 정리해 운영 리스크를 최소화
- 기존 brain image dataset에 knee image를 추가하여 대회 주제의 범용성을 높임
- 데이터 전처리, baseline 코드, 운영 기준을 명확히 문서화하여 반복 문의와 시행착오를 줄이고 원활한 대회 진행에 기여
- Github issues를 통해 대회 관련 질의응답을 수시로 진행
서울대학교 Holi Lab 학부연구인턴
2025.08 - 2026.03
- 서울대학교 조요한 교수 지도하에 학부연구인턴으로 활동
- SLM Agent 연구를 수행하며 AI Agent의 벤치마크와 시스템에 대한 이해를 심화 (논문리뷰)
‘컴퓨팅 기초’ 학부생 조교
2024.03 - 2024.06, 2024.09 - 2024.12
- 2024학년도 1학기 및 2학기 ‘컴퓨팅 기초’ 과목의 조교로 활동
- Python, 웹 크롤링, 데이터 분석 관련 실습과 프로젝트를 지원하며 학습 보조 및 질의응답 담당
서울대학교 딥러닝 학회 Deepest
2026.03 - 현재
- Rookie 트랙 참여 (딥러닝 스터디 진행)
서울대학교 중앙동아리 러닝크루 달리샤
2024.03 - 2025.02
- 주 1회 교내 운동장 정기 러닝에 참여
- 사이버 영토 수호 마라톤 대회 10km (50:58 완주) 참가
기술 스택
ML/DL
Pytorch
Huggingface