로그인

여까 게시판
아이콘샵 추가됨 다들 구매 ㄱㄱ
잡담
게임 캐릭터랑 대화하는데 성공해따!!!!!!!

GitHub - litagin02/Style-Bert-VITS2: Style-Bert-VITS2: Bert-VITS2 with more controllable voice styles.

요거 보고 개 삘 받아서 

어 잘하면 크로니한테 영어 강의 받을 수 있는거 아닌가??? 라고 생각 들어가지고 일단 일본어 기준으로 만들어봐씀다

 

 

대상은 일단 소노자키 미온

 

 

image.png



음성 처리 : 게임 음성 데이터, 대본 다뜯어서 .wav랑 txt파일 다 얻음. 이거로 전처리함

 

학습 : tyle-Bert-VITS2 이거로 함 개쩜! 집컴 글카가 4060이라 10에폭밖에 못돌렸는데 성능 개쩜!

 

코딩 : GPT랑 씨름 6시간.... 사실 어제 헛짓거리까지 하면 20시간 넘음 ㅋㅋㅋㅋ 

 

 

 

결과물

 

 

 

(안녕 미온, 오늘 하루 어땠어?) 

 

진짜 이거 처음 듣고 나서 눈물남 ㅋㅋㅋㅋㅋㅋㅋ

 

 

 

 

 

 

(님 여까 알고 있음?)

 

당연히 소노자키 시온은 1968년 생이고, 작중상 1983년이기 때문에 여까는 커녕 스트리밍도 모름!

 

 

 이거 이후로 해볼거!

 

1. 일단 미온 챗봇 Web-UI 꾸며보기. 채팅창하고 미온 이미지 표현한 2D 이미지 넣어서 꾸미기

 

 

2. 오로 크로니와 함께하는 영어공부 시간!

 

 

3. 민트 선배와 함께하는 제빵 공부!

 

 

 

1번 마무리 되는동안 2, 3번 랜덤으로 진행할거 같슴다

댓글'3'
아이콘 여까+x24 펜리루스
  • 5시간 전

고수;;;;;;

이 댓글을

이 댓글을

502나쁜문
  • 2시간 전
  • 수정: 2024.12.19 03:25:04

비슷한거 해본적 있는데 이미지에 Wav2Lip 같은 Lip motion generation 모델 사용해보심 미온이 직접 말하는 모습을 볼 수 있을검다. 전 Wav2Lip 썼는데 큰 사이즈 이미지는 얼굴 박스치는 과정에서 해상도가 깨지는 문제가 있어서 좀 최선껄 쓰시는거 추천함. STT도 보통 whisper나 SpeechRecognition 쓰라고 할텐데 CUDNN 사용 가능하면 faster-whisper 쓰는게 딜레이 가장 짧을겁니다.

이 댓글을

댓글 추첨 결과

TODO
추천
분류
제목
작성자
날짜
추천: 2
잡담
54분 전
추천: 24
구렁성
3시간 전
추천: 17
구렁성
4시간 전
추천: 22
잡담
5시간 전
추천: 23
유머/퍼온글
5시간 전
추천: 12
유머/퍼온글
5시간 전
추천: 10
익명
5시간 전
잡담 
54분 전
유머/퍼온글 
5시간 전
익명 
5시간 전