Python文字列メソッドトップ10[例付き]
公開: 2021-10-01目次
Python文字列とは何ですか?
Pythonでは、文字列は1つ、2つ、または3つの引用符で囲まれたUnicode文字の不変のシーケンスであり、エンコードに使用されます。 Unicodeの主な目的は、すべての言語のすべての文字を統一された方法でエンコードすることです。
コンピューターは2進数のみを理解し、画面に表示される文字は内部で解釈され、2進数(0と1の組み合わせ)として格納されます。 文字を数値に変換するプロセスはエンコードと呼ばれ、逆のプロセス(数値から文字)はデコードと呼ばれます。 Pythonとデータサイエンスの初心者であれば、 upGradのデータサイエンスプログラムは、データと分析の世界を深く掘り下げるのに間違いなく役立ちます。
Pythonで文字列はどのように作成されますか?
文字列は、一重引用符または二重引用符で囲まれた文字を書き込むことによって作成されます。 3つの引用符も使用できますが、通常はdocstringと複数行の文字列を示すためにのみ使用されます。
Pythonで文字列を定義する方法を示すプログラムは次のとおりです
my_string='ようこそ'
print(my_string)
my_string="ようこそ"
print(my_string)
my_string =”'ようこそ”'
print(my_string)
#三重引用符を使用して、複数行の文字列を含めることができます
my_string =“””ようこそ
私の世界"""
print(my_string)
上記のプログラムは、次の出力を生成します。
いらっしゃいませ
いらっしゃいませ
いらっしゃいませ
私の世界へようこそ
「彼女が尋ねる」のようなテキストの場合、お元気ですか? そのように出力する必要があります。ステートメントに一重引用符と二重引用符の両方があるため、構文エラーが発生します。 この場合、三重引用符を使用する必要があります。
三重引用符の代わりに、エスケープシーケンスを使用することもできます。 エスケープシーケンスはバックラッシュで始まります。 文字列が一重引用符で表されている場合は、文字列内のすべての一重引用符をエスケープする必要があります。 二重引用符の場合も同じです。
以下は、エスケープがどのように機能するかを説明するプログラムです。
print(”'彼女は「何が起こっているの?」と言った”')
print('彼女は「何が起こっているの?」と言った')
print(“彼女は言った、\”何が起こっているの?\””)
出力:
彼女は「何が起こっているの?」と言いました。
生の文字列は、文字列内のエスケープシーケンスを無視するためにも使用できます。 これは、文字列の先頭でrまたはRを使用して実行できます。
ここでは、Pythonメソッドを使用せずにPython文字列で実行できる関数のいくつかを見ていきます。
1.文字列内の個々の文字へのアクセス
個々の文字には、スライスの助けを借りて、索引付けと文字のセットを介してアクセスできます。 文字列文字へのアクセス中に発生する可能性のあるエラーには、次の2種類があります。
- インデックスの範囲は0から始まります。インデックスの範囲を超えて文字にアクセスしようとすると、 IndexErrorが発生します。
- インデックスは整数のみにすることができます。 浮動小数点数またはその他のデータ型を含めると、 TypeErrorが発生します。
Pythonのシーケンスには、負のインデックスを使用できます。 インデックス-1は最後のアイテムを示し、-2は最後から2番目のアイテムを示します。 文字列内のアイテムの範囲には、スライス演算子であるコロン(:)を使用してアクセスできます。 インデックスは、スプライシングの要素の間にあると見なされます。
Pythonで文字列文字にアクセスするためのプログラムは次のとおりです。
str='キャラクター'
print('str ='、str)
#1文字
print('str [0] ='、str [0])
#終了文字
print('str [-1] ='、str [-1])
#2〜5文字目がスライスされます
print('str [1:5] ='、str [1:5])
#6番目から2番目の最後の文字がスライスされます
print('str [5:-2] ='、str [5:-2])
上記のプログラムの出力は次のようになります。
str=文字
str [0] = c
str [-1] = r
str [1:5]=ハラ
str [5:-2] = ct
2.文字列の削除
文字列は不変であり、宣言または割り当てられた後は要素を変更できません。 異なる文字列は、同じ名前にのみ再割り当てできます。
文字を文字列から削除したり削除したりすることはできません。 ただし、delキーワードを使用すると、文字列全体を削除できます。
世界のトップ大学からオンラインでデータサイエンスコースを学びましょう。 エグゼクティブPGプログラム、高度な証明書プログラム、または修士プログラムを取得して、キャリアを早急に進めましょう。
3.文字列のマージ
2つ以上の文字列をマージまたは結合して1つの文字列を作成するプロセスは、連結と呼ばれます。 演算子+は、Pythonでの連結に使用されます。 連結の最も簡単な方法は、2つの文字列を一緒に書き込むことです。 演算子*は、指定された回数だけ文字列を繰り返すために使用されます。
以下は、文字列がどのようにマージされるかを説明するプログラムです。
str1='こんにちは'
str2='こんにちは'
print('str1 + str2 ='、str1 + str2)
print('str1 * 3 ='、str1 * 3)
出力:
str1 + str2 = HiHello
str1 * 3 = HiHiHI
Python文字列メソッド:どのように使用されますか?
Pythonには、文字列で使用できる組み込みのメソッドがたくさんあります。 さまざまなPython文字列メソッドを見て、それらがどのように使用されるかを理解しましょう。
1. Python String Capitalize()
この文字列メソッドは、最初の文字を大文字にした後、文字列のコピーを返します。 残りの文字は小文字のままになります。
以下は、capitalize()がどのように機能するかの例です。
>>> mystring =“こんにちは”
>>> print(mystring.capitalize())
出力:
やあ
2. Python String Casefold()
Casefoldは、文字列の大文字と小文字を区別したバージョンを返します。 これらのケース折りストリングは、ケースレスマッチングに利用できます。
これがどのように機能するかです:
>>> mystring =“ hi THERE”
>>> print(mystring.casefold())
出力:
やあ
3. Python String Center(width、[fillchar]
このPython文字列メソッドは、文字列を中央に配置するために使用されます。 fillcharは、文字列のパディングまたは塗りつぶし文字を指定する引数を渡します。 幅が必要な幅よりも小さい場合は、元の文字列が返されます。
これがどのように機能するかを示すプログラムです:
mystring='中央揃え'
x = mystring.center(14、'-')
print(x)
出力:
—中央—
4. Python String Count(sub、[start]、[end])
このPython文字列メソッドは、重複しない範囲(最初から最後まで)の部分文字列の出現数を出力します。 startやendなどのオプションの引数は、スライス表記で表されます。
Countメソッドの構文は次のとおりです。
string.count(substring、start =…、end =…)
string count()メソッドは、実行に1つのパラメーターのみを必要としますが、2つの追加のオプションパラメーターを持つこともできます。
- Pythonサブストリング:カウントが決定されるストリングを表します。
- start (オプション):開始インデックスは、検索を開始する文字列に含まれます。
- end (オプション):検索が停止する文字列内の最後のインデックス。
5. Python String Encode()
このPython文字列メソッドは、文字列のエンコードされたコピーをバイトオブジェクトとして表示します。 Pythonで使用されるデフォルトのエンコーディングはutf-8です。 encode()メソッドの構文は次のように記述されます。
string.encode(encoding ='UTF-8'、errors ='strict')
encode()文字列にはデフォルトパラメータは必要ありません。 文字列のutf-8エンコードされたコピーを返します。 エンコードが失敗すると、UnicodeDecodeErrorが表示されます。 encode()メソッドには2つのパラメーターがあります。
- エンコーディング:エンコードする必要のある文字列を表示します。
- エラー:これは、エンコードに失敗した場合の応答です。 エンコードが失敗した場合は、strict、ignore、replace、xmlcharrefreplace、backslashreplace、namereplaceの合計6つの応答が返されます。
6. Python文字列Endswith ()
このメソッドは、文字列が上記のサフィックスで終わる場合に「true」を表示します。 そうでない場合は、「false」と表示されます。
extendswith()メソッドの構文は次のとおりです。
str.endswith(suffix [、start [、end]])
extendswith()文字列メソッドには3つのパラメーターがあります。
- サフィックス:これは、チェックされる単一の文字列またはサフィックスのセットを示します。
- start :これは、文字列内でサフィックスをチェックする必要がある初期位置を示すオプションのパラメーターです。
- end :これは、文字列内でサフィックスをチェックする必要がある終了場所を示すもう1つのオプションのパラメーターです。
7. Python文字列expandtabs()
文字列expandtabs()は、すべてのタブ文字が空白文字に置き換えられた文字列コピーを返します。 Expand tabs()の構文は次のとおりです。
string.expandtabs(tabsize)
Expand tabs()には、常に整数のタブサイズ引数があります。 この文字列メソッドで使用されるデフォルトのタブサイズは8です。expandtab()によって返される文字列では、タブサイズパラメータの次の倍数まで、すべての'\t'文字が空白に置き換えられます。
8. Python文字列find()
find()メソッドは、最初に出現する部分文字列のインデックスを返します。 サブストリングオカレンスが見つからない場合は、-1を返します。 find()メソッドの構文は次のとおりです。
str.find(sub [、start [、end]])
find()メソッドは、3つのパラメーターを使用します。
- sub :str文字列に含まれる部分文字列を示します。
- start :これは、文字列が検索される初期位置を示すオプションのパラメーターです。
- end :これは、文字列が検索される終了位置を示すもう1つのオプションのパラメーターです。
9. Python String format()
このPython文字列メソッドは、指定された文字列をフォーマットして、見栄えの良い出力を取得するために使用されます。
format()メソッドの構文は次のとおりです。
template.format(p0、p1、…。、k0 = v0、k1 = v1、…)
- ここで、p0とp1は位置引数です。
- k0、k1、..はキーワード引数です。
- v0、v1はキーワード引数の値です。
このPython文字列メソッドは任意の数のパラメーターを持つことができますが、それらは2つのカテゴリーに分類されます。
- 位置パラメータ:中括弧{}で囲まれたパラメータのインデックスを介してアクセスできるパラメータのセット。
- キーワードパラメータ:中括弧{}で囲まれたキーパラメータを介してアクセスできるパラメータのセット。
10. Python文字列isalpha()
このメソッドは、文字列内のすべての文字がアルファベットの場合にTrueを表示します。 アルファベットでない場合、メソッドはFalseを表示します。 isalpha()メソッドの構文は次のとおりです。
ストリング。 isalpha()
isalpha()メソッドはパラメーターを使用せず、メソッドの2つの戻り値はTrueまたはFalseになります。
文字列操作は他の多くの操作と組み合わせることができるため、Pythonで最も一般的なデータ型になります。 Pythonを深く掘り下げて、この非常に求められているデータサイエンスのスキルについて詳しく知りたい場合は、upGradおよびIIIT BangaloreのデータサイエンスのエグゼクティブPGプログラムに参加して、貴重な学習体験を得る必要があります。
12か月のコースでは、25のエキスパートコーチングセッションと20以上のライブラーニングセッションで400時間以上のコンテンツを約束します。 プラットフォームの40,000以上の学習者ベースにより、学生はグローバルレベルでデータサイエンスアプリケーションに取り組むための知識と専門知識を得ることができます。 だから、待ってはいけません、今日登録してください!
Pythonは2種類の文字列のみをサポートします。 彼らです: type()は、引数の形式で指定された入力オブジェクトのデータ型を返します。 この機能はデバッグに不可欠です。 文字列データ型は、リテラル定数または変数にすることができる文字のセットです。 変数は、定数が許可しないのに、要素の変更と長さの変更を許可する場合があります。Pythonは何種類の文字列をサポートしていますか?
1.単一行の文字列
2.複数行の文字列。 Pythonのtype()の関数は何ですか?
文字列データ型とは何ですか?