Char,Unicode,ワイド文字 | Myプログラム保管庫

ASCII文字コード：
ー0x00-0x7fまでの128文字(7ビット)

シングルバイト文字セット(SBCS)：
－8ビット(1バイト)、ASCII文字

ダブルバイト文字セット(DBCS)：
－16ビット(2バイト)
－C言語ではシングルバイト文字もダブルバイト文字もchar型の配列

マルチバイト文字セット(MBCS)：
－MSDNの定義では1or2バイト文字
－上記シングル、ダブルは、ここに含まれる
－Shift-JISはここに属する

ワイド文字セット：
－常に16ビット(2バイト)
ーワイド文字はchar型では無い
ーワイド文字はwchar_t型(Unicode)
______________________________________

リテラル文字

シングルバイト文字セット
const char* str = “TEST”;
ダブルクォーテーションで囲まれた文字列を「リテラル文字」と呼ぶ

マルチバイト文字セット
const char* str = “日本語”;

ワイド文字セット
const wchar_t* str = L”先頭にＬが必須”;
______________________________________

マルチバイト文字でもUnicodeでも、コードを変えずに使用する方法：
const _TCHAR* str = _T(“これなら自動”);
ーMicrosoft固有の仕様
ーマルチバイト文字、ワイド文字（Unicode）どちらでもOk
ー仕組み：Unicodeの場合_TCHARをwchar_t型に、Unicode以外はChar型にコンパイル時に置換
______________________________________

文字列変換：

マルチバイト文字 → ワイド文字（Unicode）
MultiByteToWideChar関数(Windows API関数)
mbstowcs関数(Cランタイムライブラリ)

ワイド文字（Unicode） → マルチバイト文字
WideCharToMultiByte関数(Windows API関数)
wctomb関数(Cランタイムライブラリ)