팀 회의록 - 2026-01-16
회의 기본 정보
날짜: 2026-01-16 시간: 09:00 ~ 09:30 (총 30분) 회의 유형: 참석자: 김명환, 김민혁, 박지윤, 이솔형 회의 주도: 박지윤
회의 목적
프로젝트 진행상황 간단 공유
주요 안건 및 논의사항
1. 진행 현황 공유
각자 진행 상황:
- 김명환: 파이프라인 구축, 모델 연구
- 김민혁: 텍스트 생성 모델 작업
- 박지윤: 진행 사항 및 일정 체크, 브랜치 테스트
- 이건희: 불참
- 이솔형: 이미지 생성 모델 작업
2. 핵심 논의사항
주요 이슈:
- 이미지 생성 시 FLUX v2 모델 제안
- 입력 이미지를 생성된 배경 위에 합성할 때 위치 잡기나 그림자 처리가 어려운데,
- FLUX v2는 입력 이미지를 주면 자동으로 자연스럽게 합성해 줌
- FLUX v2를 이용하여 우드 테이블 등 원하는 배경과 오브젝트가 정확하게 생성됨
- 출시 한 달밖에 안되어 개발 자료가 부족하고 양자화가 어려움
- FLUX v1는 결과물이 만족스럽지 않음
- FLUX v2를 돌리려면 최소 90GB 디스크 여유 공간과 60GB 메모리 필요
- 양자화 시 약 20GB 수준으로 줄일 수 있으나, 현재 실패 중으로 계속 연구 필요
- CPU 모드로 돌리면 가능하지만 생성 시간이 너무 오래 걸림
- 텍스트 생성 시 HTML 랜더링 방식 제안
- AI 모델로 텍스트까지 그리려고 하니 한글이 깨지는 현상이 계속 발생함
- AI 모델로 글자를 그리는 방식 대신 프로그래밍 방식 제안
- LLM(GPT)에게 HTML 코드를 짜달라고 요청해서 광고 텍스트 생성
- 한글 깨지지 않고 우리가 원하는 어느 정도 텍스트 효과 확인
- 생성된 HTML 코드를 Playwright라는 파이썬 라이브러리를 이용하여 랜더링
- GPT를 쓴다면 코드를 달라고 하는 것보다 이미지를 주고 텍스트를 달라고 하는 방식이 더 낫지 않은지 논의
- 이미지 픽셀 사이즈가 커서(변환하면 1MB 이상) 파일로는 못보내고 Base64로 변환해야 함, 바이너리로는 안 됨
- 시도 예정이나, 이미지를 분석해서 어울리는 색감으로 HTML 코드를 짜주는 방식으로 응용하면 더 좋은 퀄리티 예상
- HTML 랜더링 방식이 스텝 2(텍스트 생성) 할 필요 없이 바로 합성 가능
- Segmentation FCN ResNet50을 사용하여 이미지에서 텍스트가 들어갈 빈 공간을 찾아 좌표를 추출하는 방식 진행 중
- 그 좌표에 텍스트 이미지를 합성
- HTML 랜더링 방식으로 변경 고려 중
- 전단지 예시 공유(구글링) 및 목표로 정함
- 이미지 생성은 FLUX.1-dev 모델을 4bit 양자화된 버전을 찾아서 테스트 진행 중
- 로컬에서 테스트 시 OOM으로, 코랩에서 진행 중이나 아직 좋은 결과를 보지 못함
- 특화 타겟 혼선 및 논의
- 기본적으로 전통시장을 메인 타겟으로 진행하되,
- LangGraph 사용해서 확장이나 변경이 가능하므로, 확장 가능성을 열어두는 방향
- 테스트 과정에서 나온 실패한 이미지를 비롯한 중간결과물들 모두 발표자료 폴더에 모아둘 것
논의된 해결방안:
팀 결정사항:
역할 분담 및 액션 아이템
| 담당자 | 업무 | 마감일 | 우선순위 |
|---|---|---|---|
| 00/00 |
다음 회의
일정: 2026-01-19 09:00
안건:
준비사항:
기타 사항
참고 링크:
공유 자료:
특이사항:
작성자: 박지윤 작성 시간: