ABAP字符串处理 – 个人学习记录

字符串表达式

可以使用&或&&将多个字符模板串链接起来，可以突破255个字符的限制，下面两个是等效的：

|…| & |…|

|…| && |…|

如果内容只有字面常量文本（没有变量表达式或控制字符\r \n \t），则不需要使用字符模板，可这样（如果包含了这些控制字符时，会原样输出，所以有这些控制字符时，请使用 |…|将字符包起来）：

`…` && `…`

但是上面3个与下面3个是不一样的：

`…` & `…`

‘…’ & ‘…’

‘…’ && ‘…’

上面前两个还是会受255个字符长度限制，最后一个虽然不受255限制，但尾部空格会被忽略

字面常量文本（literal text）部分，使用 ||括起来，不能含有控制字符（如 \r \n \t这些控制字符），特殊字符 |{ } \需要使用 \进行转义：

txt = |Characters \|, \{, and \} have to be escaped by \\ in literal text.|.

字符串表达式：

str = |{ ( 1 + 1 ) * 2 }|.“算术计算表达式
str = |{ |aa| && ‘bb’ }|.“字符串表达式
str = |{ str }|.“变量名
str = |{ strlen( str ) }|.“内置函数

字符串处理

SPLIT dobj AT sep INTO { {result1 result2 …} | {TABLE result_tab} }
必须指定足够目标字段。否则，用字段dobj的剩余部分填充最后目标字段并包含分界符；或者使用内表动态接收

CONDENSE <c> [NO-GAPS].
如果是C类型只去掉前面的空格（因为是定长，即使后面空格去掉了，左对齐时后面会补上空格），如果是String类型，则后面空格也会被去掉；字符串中间的多个连续的空格使用一个空格替换(String类型也是这样)；NO-GAPS：字符串中间的所有空格都也都会去除(String类型也是这样)；空格去掉后会左对齐[kənˈdens]

CONCATENATE {dobj1 dobj2 …}|{LINES OF itab}[kənˈkatɪneɪt]
            INTO result
            [SEPARATED BY sep]
            [RESPECTING BLANKS].

CDNT类型的前导空格会保留，尾部空格都会被去掉，但对String类型所有空格都会保留；对于c, d, n, t类型的字符串有一个RESPECTING BLANKS选项可使用，表示尾部空格也会保留。注：使用 “ 对String类型进行赋值时才会保留尾部空格

strlen(arg)、Xstrlen(arg)
String类型的尾部空格会计入字符个数中，但C类型的变量尾部空格不会计算入

SHIFT dobj {[{BY num PLACES}|{UP TO sub_string}][[LEFT|RIGHT][CIRCULAR]]}
| { {LEFT DELETING LEADING}|{RIGHT DELETING TRAILING} } pattern

对于固定长度字符串类型，shift产生的空位会使用空格或十六进制的0（如果为X类型串时）来填充

向右移动时前面会补空格，固定长度类型字符串与String结果是不一样：String类型右移后不会被截断，只是字串前面补相应数量的空格，但如果是C类型时，则会截断；左移后后面是否被空格要看是否是固定长度类型的字符串还是变长的String类型串，左移后C类型会补空格，String类型串不会（会缩短）

CIRCULAR：将移出的字符串放在左边或者左边

pattern：只要前导或尾部字符在指定的pattern字符集里就会被去掉，直到第一个不在模式pattern的字符止

substring( val = TEXT [off = off] [len = len] )

count( val = TEXT {sub = substring}|{regex = regex} )匹配指定字符串substring或正则式regex出现的子串次数，返回的类型为i整型类型

contains( val = TEXT REGEX = REGEX)是否包含。返回布尔值，注：只能用在if、While等条件表达式中

matches( val = TEXT REGEX = REGEX)regex表达式要与text完全匹配，这与contains是不一样的。返回布尔值，也只能用在if、While等条件表达式中

match( val = TEXT REGEX = REGEX occ = occ)返回的为匹配到的字符串。注：每次只匹配一个。occ：表示需匹配到第几次出现的子串。如果为正，则从头往后开始计算，如果为负，则从尾部向前计算

find( val = TEXT {sub = substring}|{regex = regex}[occ = occ] )查找substring或者匹配regex的子串的位置。如果未找到，则返回 -1，返回的为offset，所以从0开始

FIND ALL OCCURRENCES OF REGEX regex IN  dobj
  [MATCH COUNT  mcnt]   成功匹配的次数
  { {[MATCH OFFSET moff][MATCH LENGTH mlen]}最后一次整体匹配到的串（整体串，最外层分组，而不是指正则式最内最后一个分组）起始位置与长度
  | [RESULTS result_tab|result_wa] } result_tab接收所有匹配结果，result_wa只能接收最后一次匹配结果
  [SUBMATCHES s1 s2 …].通常与前面的MATCH OFFSET/ LENGTH一起使用。只会接收使用括号进行分组的子组。如果变量s1 s2 …比分组的数量多，则多余的变量被initial；如果变量s1 s2 …比分组的数量少，则多余的分组将被忽略；且只存储第一次或最后一次匹配到的结果

replace( val = TEXT REGEX = REGEX WITH = NEW)使用new替换指定的子符串，返回String类型

REPLACE ALL OCCURRENCES OF REGEX regex IN dobj WITH new

count、match结合

DATA: text TYPE string VALUE `Cathy’s cat with the hat sat on Matt’s mat.`,
      regx TYPE string VALUE `\<.at\>`.”\< 单词开头，\> 单词结尾
DATA: counts TYPE i,
index TYPE i,
      substr TYPE string.
WRITE / text.
NEW-LINE.
counts = count( val = text regex = regx ).”返回匹配次数
DO counts TIMES.
index = find( val   = text regex = regx occ = sy-index ).”返回匹配到的的起始位置索引
  substr = match( val  = text regex = regx occ = sy-index ).”返回匹配到的串
index = index + 1.
WRITE AT index substr.
ENDDO.