広告スペース（AdSense審査通過後にここへ配置）

文字列を入力

テキスト（貼り付けOK）サンプルを試す

UTF-8 バイト数

— バイト

文字数—
UTF-8 バイト数—
Shift_JIS 概算—
UTF-16 バイト数—

広告スペース

📘 説明と計算式

文字数＝絵文字や結合文字を1つの見た目単位として数えます（Intl.Segmenter対応ブラウザ）。サロゲートペアの絵文字も1文字として数えます。
UTF-8 バイト数＝TextEncoder で正確に算出。ASCII（半角英数記号）は1バイト、ひらがな・漢字など日本語は3バイト、一部の絵文字は4バイトです。
Shift_JIS 概算＝全角文字を2バイト、半角文字を1バイトとして概算します。実際のShift_JISは未対応文字があるため、あくまで目安です。
UTF-16 バイト数＝1コードユニット2バイト（サロゲートペアは4バイト）として算出します。
改行コードもバイト数に含まれます（環境により1〜2バイト）。本ツールはブラウザ標準の改行（LF＝1バイト）で計算します。

📖 文字のバイト数の使い方と解説

入力した文字列が何バイトになるかを、UTF-8・Shift_JIS・EUC-JP・UTF-16 といった文字コード別に計算します。データベースの桁数設計やファイルサイズの見積もり、文字数制限の確認に役立ちます。

バイト数は「各文字を指定の文字コードで符号化したときの合計バイト数」です。文字コードによって1文字に割り当てるバイト数が異なります。

例として「あA1」を計算すると、UTF-8では「あ（3バイト）＋A（1バイト）＋1（1バイト）＝5バイト」、Shift_JISでは「2＋1＋1＝4バイト」になります。「こんにちは」（全角5文字）はUTF-8で15バイト、Shift_JISで10バイトです。

Q. 文字数とバイト数は何が違いますか？

A. 文字数は文字の「個数」、バイト数は保存・送信に必要な「データ量」です。半角英数字なら多くのコードで一致しますが、日本語が混じるとバイト数は文字数より大きくなります。

Q. 同じ文字列なのにバイト数が違うのはなぜですか？

A. 文字コードごとに1文字あたりの符号化バイト数が違うためです。たとえば漢字はUTF-8で3バイト、Shift_JISで2バイトと、コードによって変わります。

Q. 絵文字は何バイトになりますか？

A. 多くの絵文字はUTF-8で4バイトです。さらに肌の色や合成絵文字は複数の符号が連結され、見た目1文字でも合計バイト数が大きくなることがあります。

データベースのVARCHAR(255)などはバイト基準の場合があり、日本語ではUTF-8で実際に入る文字数が想定より少なくなります。設計時はバイト数で確認すると安全です。
「文字数制限○バイトまで」と書かれたフォームやSNSでは、全角を多く使うほど早く上限に達します。送信前のチェックに使えます。
迷ったら現在主流のUTF-8を基準にしましょう。Web表示やJSON、APIの多くがUTF-8を前提にしています。