java String split 踩坑记

split操作是出镜率非常高的一个方法, 但是我们使用中通常会使用两个类提供的split方法, 他们在入参类型一样, 但是效果却有一些差别, 稍不注意容易踩坑.

java.lang.String#split

String提供了两个重载方法:

public String[] split(String regex, int limit)
public String[] split(String regex) 

regex参数指定用于分割的正则表达式; limit用于限定分割次数, 小于等于0时表示不限制全部切割.

org.apache.commons.lang.StringUtils#split

StringUtils提供了四个重载方法:

String[] split(String str)
String[] split(String str, char separatorChar)
String[] split(String str, String separatorChars)
String[] split(String str, String separatorChars, int max)

str即待分割的字符串, separatorCharseparatorChars指定分割符, 注意这里是字符串本身而不是正则. max等效于上面的limit用于限定分割次数.

区(有)别(坑)

相邻分隔符的处理不同

String#split会把临近的分割符合并处理, 而StringUtils#split不会.
String str = "a,,b";

String[] arr1 = StringUtils.split(str, ",");
System.out.println(Arrays.toString(arr1) + " @ " + arr1.length);
// [a, b] @ 2

String[] arr2 = str.split(",");
System.out.println(Arrays.toString(arr2) + " @ " + arr2.length);
// [a, , b] @ 3

空字符内容的处理不同

StringUtils#split会丢掉分割出来的空字符, 而String#split不会.
String str = ",,a,,b,,";

String[] arr1 = StringUtils.split(str, ",");
System.out.println(Arrays.toString(arr1) + " @ " + arr1.length);
// [a, b] @ 2

String[] arr2 = str.split(",");
System.out.println(Arrays.toString(arr2) + " @ " + arr2.length);
// [, , a, , b] @ 5

发表评论

电子邮件地址不会被公开。

× 7 = 42