Javascript字符串拆分阿拉伯语/波斯语字符串中的问题

我试图使用
javascript字符串拆分拆分两个波斯字符,但它没有正确拆分.

var test = '"حسن روحانی"،"حسن+روحانی"';
var tmpkeywords =  test.split(',');
console.log(tmpkeywords);

拆分结果应该是:
[“”حسنروحانی“”,“”حسنروحانی“”]

但它反而像[“”حسنروحانی“,”حسنروحانی“coming”].它适用于英文字符或数字.

我的小提琴:https://jsfiddle.net/tueo3sfa/1/

最佳答案 你的字符串“حسنروحانی”,“حسنروحانی”不包含字符“,”(U 002C COMMA)但是“,”(U 060C ARABIC COMMA):这就是为什么它不会拆分并返回整个原始字符串.

为了得到你想要的东西,你需要用“,”分开

var test = '"حسن روحانی"،"حسن+روحانی"';
var tmpkeywords =  test.split(',');
console.log(tmpkeywords);

另请注意,在其他语言中有许多不同的逗号,如果您需要以通用方式处理它们,您可能需要全部指定它们(原始未过滤列表http://www.fileformat.info/info/unicode/char/search.htm?q=comma&han=Y&preview=entity),或者,如果适用,还要使用Unicode类(例如,通过标点符号拆分)字符,参见http://inimino.org/~inimino/blog/javascript_cset的例子).

点赞