본문 바로가기

분류 전체보기

(83)
vscode 파일 날라갔을때, 여기 저장되어있을수도 있으니 시간순으로 뒤지기 cd ~/.vscode-server/data/User/History ls -alt 하고, 최신순으로 뒤지기
CLIPVisionModel Projection, PBE image encoder to SDXL 이식기록 *1 : batch norm, layer norm 차이 :  https://yonghyuc.wordpress.com/2020/03/04/batch-norm-vs-layer-norm/*2 : CLIPVisionModel output  : CLIPVisionModel의 output은 CLIPVisionTransformer을 받아오는거랑 같다.                                                  CLIPVisionModel의 forward 가 self.vision_model(..) 을 return 하기 때문이다.                                                  vision_model = CLIPVisionTransformer 이다.  ..
[에러해결] error: RPC failed; curl 56 GnuTLS recv error (-9): Error decoding the received TLS packet. 위와 같은 에러 발생시, 아래 3줄 실행 sudo apt install gnutls-bin git config --global http.postBuffer 1048576000 // 1G git config --global http.sslVerify false 기타 이슈도 아래 링크에서 잘 정리되어있는듯하다. https://yoech.com/thread-498.htm
Virtual Tryon(개발 아이디어) 1. 일단 img2img의 효과에 대해서 알고싶다.     학습시켰던 controlnet 모델이 모델의 얼굴은 잘 내보내는데, 옷부분이 무너진다.     이 부분에 대해서 img2img를 수행했을때, 어떤 결과가 나오는지 보자.   2. 해봐야 하는 실험 ? > 사람 유지적 측면에서 controlnet을 쓰면 더 좋아 질 순 있지만, 굳이 안써도됨. 그래서 controlnet은 일단 빼고,  Image Embedding의 효과에 대해서 좀 더 고민할껀데, 학습시 masked condition을 사용해서 9 channel unet을 학습 시킬려고함  unet 학습, mask를 주고, ( masked = 팔+상체+손 )condition ( image embedding) = 의복 줌.   일부만 학습더보기  ..
clip - ViT & Image projection clip에서 사용하는 vit , Image encoder의 pooled output 을 상세하게 확인한다.    # ViT 구조 더보기   이미지 encoder  패치의 크기는 P이다. ViT 14는 각 패치의 크기가 14란 뜻이다.  1개의 패치의 크기는 14x14 이고, 이건 1개의 토큰이 된다.  더보기따라서 이미지 (224 * 224 * 3)를 패치화 한다면, 224 / 14 = 16    =>  16*16 * 3 = 768 이  된다. 따라서 1장은 768개의 token을 갖는 문장처럼 다룬다.     텍스트 encoder  텍스트 프롬프트는 77개의 토큰으로 변환되고,   이걸 768 으로 임베딩 한다.  헷갈리지 말자 point1 )  clip 훈련시(contrastive learrning)..
tmux 단축키 정리 1. 세션 생성 tmux new -s mysession 2. 마지막 세션에 붙기 tmux a = tmux at = tmux attach = tmux attach-session 3. 특정 세션 붙기 tmux a -t mysession = 위에처럼 사용가능 4. 세션 내에서 윈도우 조작 모드 ( 조작모드후 page up/page down 을 하면 쉽게 이동 ) ctrl + b , [ 5. 세션 활성화 상태로 떼어내기 ctrl +b, d 6. 세션 종료 ctrl + d 7. 윈도우 닫기 ctrl + b , x 8. tmux 종료 tmux kill-server 9. 윈도우 종료 exit c : 윈도우 생성 & : 윈도우 닫기 n : 다음 윈도우 p : 이전 윈도우 0~9 : 윈도우 넘버 l : 윈도우 리스트 7..
[diffusers] controlnet 코드 분석 코드 매우 심플한데, 효과적인 생성방법. down block, mid block 부분 controlnet에서 떼옴 .  down_block_res_samples, mid_block_res_sample = controlnet(                    noisy_latents,                    timesteps,                    encoder_hidden_states=encoder_hidden_states,                    controlnet_cond=controlnet_image,                    return_dict=False,                )unet 의 down block부분과 mid block부분을 업데이..
git 관리... # 원격 브랜치 삭제 git push origin -d clothes # branch 만들고, 이동 git checkout -b clothes # 올릴 파일 리스트 업데이트 git add * # 올릴 파일들에 대한 코멘트 git commit -m "revised list" # 원격지에 올리기 git push # 원격지에서 변경내역 받아오기 git pull # 원격지랑 다른게 있어서 에러 뜰 때 1) 로컬에 있던 변경 내용을 잠깐 stash에 옮긴다. : git stash 2) 이제 원격지 내용을 가져온다 : git pull 3.1 ) 필요없는거면 그냥 버린다 : git stash drop 3.2 ) stash 에 옮겼던거 덮어쓴다 : git stash pop # git commit 취소 $ git res..