tokenize-regexp

www.altova.com このトピックを印刷 前のページ 1つ上のレベル 次のページ

ホーム >  関数 > 関数ライブラリレファレンス > core | string functions >

tokenize-regexp

input から得られた文字列を、文字列 (string) のシーケンスに変換します。pattern パラメーターにて得られた正規表現のパターンにマッチする文字列がセパレーターとして使用されます。セパレーターとして使用された文字列は関数の出力に表示されません。オプションの flags を使用することもできます。

 

fn-tokenize-regex

 

 

regex1

 

上に示される例では:

空白スペースとコンマで区切られた文字列 (a , b, c,d) が input パラメーターから与えられています。

 

pattern に接続されている正規表現は [ ,] (["space""comma"])となっており、空白スペースとコンマのどちらか一方がマッチする文字がセパレーターとして使用されます。

 

+ 文字を使用することで、「 1 つ以上の」連続した文字クラス/文字列の出現にマッチすることができます。

 

返される結果を以下に示します:

regex2

 

言語によって正規表現には細かな違いがある点に注意してください。C++ の Tokenize-regexp は Visual Studio 2008 SP1 以降でしか扱えない点に注意してください。

 

正規表現に関する更に詳しい情報については 正規表現のセクションを参照ください。


(C) 2019 Altova GmbH