Python Split 関数: Split 関数の概要 ()
公開: 2023-05-25目次
Python の Split() 関数の概要
Python の Split 関数は、大きな文字列を分割して小さな文字列に簡単に処理できるようにする文字列操作ツールです。 この関数は、さまざまな文字列を 1 つに結合する文字列の連結とは対照的に機能します。 文字列を評価し、すでに指定されている区切り文字を検出した場合に分離します。
分割関数がPython 分割リストから事前定義された区切り文字を見つけられなかった場合、デフォルトで空白を使用します。 さらに、この関数は、カンマ (,) 文字などの区切り文字列を使用して行または文字列を区切った後の単語で構成されるリストを返します。
Python で Split 関数を使用する方法を知りたいですか?実装を改善するためにこの関数のすべてを理解するには読み続けてください。
無料のコースをチェックして、競争に勝ちましょう。
基本的な構文とパラメータ
Python の分割関数の構文は次のとおりです。
string.split(区切り文字,最大)
これらの各パラメーターの意味を理解しましょう。
区切り文字:
セパレータは、文字列をどこで分割するかを Python に指示します。 基本的に、区切り文字として機能し、事前定義された区切り文字に基づいて文字列を区切ります。 文字列は、前述の区切り文字で分割されます。 このパラメーターはオプションであるため、区切り文字を指定しない場合、split 関数はデフォルトの区切り文字として空白を利用します。
これは、出力に存在する各変数の間に配置される、事前定義された Python 分割文字列として機能します。
最大分割:
Python で分割関数の使用方法を学びたい場合は、このパラメーターの重要性を理解する必要があります。これは、文字列を何回分割する必要があるかを正確に示す数値です。 オプションです。 したがって、指定されていない場合、デフォルト値は -1 になります。
Maxsplit の値に制限はありません。これは、文字列を分割できる回数に制限がないことを意味します。
この関数は、前述の区切り文字で文字列を分割した後、Python の文字列分割リストを返します。
通常、これらのパラメーターは文字列 Python を文字ごとに分割します。
世界のトップ大学のデータ サイエンス コースをオンラインで学びましょう。 エグゼクティブ PG プログラム、上級認定プログラム、または修士プログラムを取得して、キャリアを加速させましょう。
文字列を部分文字列のリストに分割する
Python では、文字列を区切り文字で構成されるリストに分割するということは、出力には部分文字列の細分化されたリストが表示されることを意味します。 どの区切り文字も、 Python の文字列分割関数の区切り文字のように機能して、文字列のリストに分割できます。
以下は、文字列をリストに分割する方法の例です。
str = “年-月-日”
print(str.split(“-”))
出力は次のとおりです。
['年月日']
Pythonで文字列を文字ごとに分割する上記の例では、区切り文字として使用される間にダッシュ文字 (-) を含む文字列を使用して str変数が宣言されています。この操作では、ダッシュが表示されるたびに文字列が分割されます。文字列 Python を文字ごとに分割した場合の対応する出力は、部分文字列のリストです。
分割するセパレータの指定
Python 分割文字列のデフォルトの区切り文字は空白です。
以下は、分割用の区切り文字を指定する方法を示す例です。
subj = '英語、地理、数学、GK'
print(subj.split(','))
野菜 = 'ジャガイモ$タマネギ$キャベツ$エンドウ豆'
print(野菜.split('$'))
出力
[「英語」、「地理」、「数学」、「GK」]
[「ジャガイモ」、「タマネギ」、「キャベツ」、「エンドウ豆」]
上記の最初の例では、 subj.split(',')関数は区切り文字としてカンマを指定しています。
上記の 2 番目の例では、 vegetables.split('$') で区切り文字として$記号が言及されています。したがって、split() メソッドは文字列を区切り文字ごとに分割し、文字列の各部分をリストに組み込みます。
人気のデータ サイエンス コースを探索する
IIITB のデータ サイエンスのエグゼクティブポスト大学院プログラム | ビジネス意思決定のためのデータ サイエンスのプロフェッショナル認定プログラム | アリゾナ大学でデータサイエンスの理学修士号を取得 |
IIITB のデータ サイエンスの上級認定プログラム | メリーランド大学のデータ サイエンスとビジネス分析のプロフェッショナル認定プログラム | データサイエンスコース |
分割数の制限
Python の分割関数の 2 番目のパラメータに数値を指定するだけで、分割の数を制限できます。
以下の例では、maxsplit パラメータの数値を指定することで分割を制限しています。
subj = '英語、地理、数学、GK'
print(subj.split(',', 2))
野菜 = 'ジャガイモ$トマト$タマネギ$エンドウ豆'
print(野菜.split('$', 2))
出力:
[「英語」、「地理」、「数学、GK」]
['ジャガイモ'、'トマト'、'オニオン$エンドウ豆']
上の例では、 subj.split(',', 2) はmaxsplit 引数として 2 を定義します。したがって、subj 文字列を 2 回分割し、リスト オブジェクトには 4 つの要素が含まれます。 3 番目の要素は残りの文字列を示します。
Vegetable.split('$', 2)関数では、文字列が 2 回分割されます。返されるリストは 3 つの要素で構成されます。
文字列を末尾から分割する
Pythonには文字列を文字列の末尾から分割するsplitメソッドがあります。 組み込みの Python 関数 rsplit() は、区切り文字が最後に出現した位置で文字列を分割します。
rsplit() 関数の構文は次のとおりです。
rsplit(“区切り文字”, 引数)
例:
rsplit(“区切り文字”,1)
上記のrsplit()関数では、引数として1が渡されます。 したがって、末尾から区切り文字を 1 つだけ取得して文字列を分割します。 文字列に複数の区切り文字が含まれており、引数として 2 が渡された場合、rsplit 関数は最後の区切り文字だけでなく最後から 2 番目の区切り文字からも文字列を分割します。
空白をsplit()で削除する
次の手順は、 Python の Split メソッドを使用して空白を削除するのに役立ちます。
ステップ 1: 文字列を分割し、空白を削除します。
この手順では、str.split() メソッドを使用して文字列をリストに分割します。 区切り文字を使用して文字列を部分文字列のリストに分割します。
このメソッドに関係する唯一の引数は区切り文字です。 カンマが現れるたびに文字列を分割します。
ステップ 2: 内包表記のリストを使用して文字列リストを反復処理します。
このステップにより、ユーザーは文字列のリストを反復する必要がある内包表記のリストを定義できます。
ステップ 3: str.strip() メソッドを使用する:
このステップでは、反復ごとに str.strip() メソッドを使用して、文字列から先頭または後の空白を削除します。 このメソッドは、先頭と末尾の空白が削除された文字列のコピーを返します。
スキルアップのために学ぶべきトップのデータ サイエンス スキル
SL。 いいえ | 学ぶべきトップのデータ サイエンス スキル | |
1 | データ分析オンラインコース | 推論統計オンライン コース |
2 | 仮説検証オンライン コース | ロジスティック回帰オンライン コース |
3 | 線形回帰コース | 解析のための線形代数オンライン コース |
空の文字列およびその他のエッジケースの処理
.split() メソッドを使用すると、出力リストに欠損値または空の文字列が含まれる場合があります。 区切り文字に空の文字列がある場合、split() メソッドは ValueError を表示します。
次の例で、split 関数が空の文字列をどのように処理するかを理解しましょう。
データ = “,ジャガイモ,タマネギ,キャベツ,,エンドウ豆,”
野菜 = data.split(',')
プリント(野菜)
出力:
[”、'ジャガイモ'、'玉ねぎ'、'キャベツ'、'、'エンドウ豆'、'】
空の文字列があるため、上記の出力は理想的ではありません。 内包表記のリストを使用して、定義されたリストから空の文字列を削除できます。 その方法は次のとおりです。
野菜 = [”、「玉ねぎ」、「大根」、「コリアンダー」、”]
野菜 = [野菜の場合は野菜 if 野菜 != ”]
プリント(野菜)
出力:
[「玉ねぎ」、「大根」、「コリアンダー」]
パフォーマンスに関する考慮事項
Python の Split 関数は、文字列を解析する効率的な方法を提供します。 これを最大限に活用する最善の方法は、正確に実装するためのパフォーマンスに関する考慮事項を理解することです。 最も有名なもののいくつかを見てみましょう:
文字列のサイズ:大きな文字列の分割は、特に文字列がメモリにキャッシュされていない場合、かなり時間がかかるプロセスになる可能性があるため、split() 関数のパフォーマンスは入力文字列のサイズに大きく影響されます。
区切り文字: split() 関数は正規表現を使用して文字列を分割しますが、複雑な区切り文字の場合は速度が遅くなる可能性があります。スペース、タブ、カンマなどの単純な区切り文字を使用すると、分割にかかる時間が短縮されます。
分割の数:分割の数が多数である場合、関数がより多くのリソースを利用し、実行が遅くなる可能性があります。分割の数を制限するには、オプションの maxsplit パラメータを利用できます。
メモリ使用量: Split() 関数は、文字列を分割するたびに新しいリスト オブジェクトを生成します。より大きな文字列を扱う際には、メモリの問題などの課題が必ず発生します。 これを軽減する 1 つの方法は、ジェネレーター式を使用することです。これは、新しいリスト オブジェクトを作成せず、代わりに分割文字列をその場で生成します。
結論とさらなる学習の機会。
要約すると、split() 関数は、幅広い Python プログラムやアプリケーションで使用できる多用途ツールです。 これは、テキスト データを操作する場合や文字列を操作する場合に特に便利です。
私たちのブログが、Python の基礎を強化し、キャリアを前進させるのに十分な洞察を提供できれば幸いです。 しかし、始めるのに必要なのは基本を練習するだけだと思いますか?
正しいアプローチに加えて、キャリアを向上させるための原動力となるものは何でしょうか?
upGrad の Python プログラミング ブートキャンプを受講して、データ サイエンスの分野で優れたキャリアの機会を模索してください。
コーディングの初心者にとって、データ サイエンスの輝かしいキャリアに乗り出すことは非常に有益です。 このコースを受講することで得られる優れたメリットには、疑問を解消するセッション、コーディングの練習問題、ライブのインタラクティブなクラス、業界の専門家からの学習などが含まれます。
Python プログラミングを習得することに加えて、upGrad は、 LJMU のデータ サイエンスの科学修士や、 IIIT バンガロールのデータ サイエンスのエグゼクティブ PG プログラムなどのコースを受講することで、データ サイエンティストとしてのキャリアを向上させることも支援します。 これらのプログラムでは、業界の専門家や一流の教員が事後評価や詳細な評価を行う、需要の高いスキルを継承することができます。
upGrad でキャリアをスタートさせましょう!