본문 바로가기

지식

한글 바이트 byte

euc-kr

에서 한글은 

한글자당 2바이트

 

김미안 -> 6바이트

 

*********

2바이트 = 16비트

1비트 한영구분

5비트 초성, 5비트 중성, 5비트 종성

**********

 

UTF-8

에서 한글은

한글자당 3바이트

 

김미안 -> 9바이트

lengthb 바이트길이 출력메소드

 

 

 

 

*****

Q.  모든 문자를 커버하는 UTF로 도배하면된다고 들었는데요??

A. encoding type 하나로 용량차이가 어마어마해진다
     2테라바이트의 용량을 차지하던것이 UTF로 3테라가 될수있다

     하지만 이거는 db쪽에서 저장시 전문가들이 고민해야할 문제 
     우리수준에서는 UTF로 도배해도 됩니다
     어떤 차이가 있는지를 알고 하자

 

 

참고사항 encoding scheme

'지식' 카테고리의 다른 글

__pycache__ (자바에서는 .class)  (0) 2023.03.29
is exceeding the 65535 bytes limit  (0) 2022.10.11
시스템변수, 사용자변수  (0) 2022.07.11
duck typing(덕 타이핑)(.feat 정적,동적)  (0) 2022.07.11
특정 파일에 권한 부여  (0) 2022.06.06