UTF-8
1학년 때 컴퓨터 개론에서 아스키 코드(ASCII-code), 유니 코드(Uni-code)에 대한 내용을 살짝 스쳐간 기억이 있다. 둘 다 숫자로 문자를 표현하는 방식인데, 간단히 짚고 넘어가자면 아스키 코드 - 128개(7비트)의 문자를 사용 - C언어의 char는 1바이트인데? => 남은 1비트는 통신 에러 검출을 위한 패리티 비트(Parity Bit) - 영어만 존재 => ASCII의 A가 American임 유니 코드 - 전 세계 문자를 표현하기 위해 국제 표준 코드 등장 - 처음에는 2바이트(65,536)에 모두 담을 수 있다고 생각했지만, 어림도 없었음 - 계속 업데이트 중(14.0 버전이 지난 9월 22일에 나왔다고 함) - UTF-8, UTF-16, UTF-32 등 다양한 인코딩 방식이 존재..
Study/Computer Science
2021. 12. 21. 22:17