PHP 中 strpos、strstr 和 stripos、stristr 函数源码解析

strpos

mixed strpos ( string $haystack, mixed $needle [, int $offset = 0 ] )

如果offset指定了,查找会从offset的位置开始。offset不能为负数。

返回needle第一次出现在haystack的位置。如果在haystack中找不到needle,则返回FALSE。

needle,如果needle不是字符串,它会被转换成整型数值并赋值为该数值的ASCII字符。请看下面例子。

一、strstr — 查找字符串的首次出现 string strstr ( string $haystack ,
mixed $needle [, bool $before_needle = false ] )
注1:$haystack是当事字符串,$needle是被查找的字符串。该函数区分大小写。
注2:返回值是从needle开始到最后。
注3:关于$needle,如果不是字符串,被当作整形来作为字符的序号来使用。
注4:before_needle若为true,则返回前东西。 复制代码 代码如下: 二、stristr
strstr不区分大小写的版本 三、strpos -查找字符串首次出现的位置 int strpos
( string $haystack , mixed $needle [, int $offset = 0 ] ) 注1:可选的
offset 参数可以用来指定从 haystack
中的哪一个字符开始查找。返回的数字位置是相对于 haystack
的起始位置而言的。 四、substr -返回字符串的子串 string substr ( string
$string , int $start [, int $length ] ) $rest = substr; // 返回 “f”
注1:如果 start 是非负数,返回的字符串将从 string 的 start 位置开始,从
0 开始计算。例如,在字符串 “abcdef” 中,在位置 0 的字符是 “a”,位置 2
的字符串是 “c” 等等。 注2:如果 start 是负数,返回的字符串将从 string
结尾处向前数第 start 个字符开始。 注3:如果 string 的长度小于或等于
start,将返回 FALSE。 length 注4:如果提供了正数的
length,返回的字符串将从 start 处开始最多包括 length 个字符。
注5:如果提供了负数的 length,那么 string
末尾处的许多字符将会被漏掉。如果 start
不在这段文本中,那么将返回一个空字符串。 注6:如果提供了值为 0,FALSE 或
NULL 的 length,那么将返回一个空字符串。 注7:如果没有提供
length,返回的子字符串将从 start 位置开始直到字符串结尾。 复制代码 代码如下: 五、strrchr
-查找指定字符在字符串中的最后一次出现 string strrchr ( string $haystack
, mixed $needle ) 该函数返回 haystack 字符串中的一部分,这部分以 needle
的最后出现位置开始,直到 haystack 末尾。 六、strripos
-计算指定字符串在目标字符串中最后一次出现的位置 七、stripos
-查找字符串首次出现的位置 八、strrpos
-计算指定字符串在目标字符串中最后一次出现的位置

  • strstr —
    查找字符串的首次出现,返回字符串从第一次出现的位置开始到该字符串的结尾或开始。
  • stristr — strstr 函数的忽略大小写版本
  • strchr — strstr 函数的别名
  • strrchr —
    查找字符串的最后一次出现,返回字符串从最后一次出现的位置开始到该字符串的结尾。

澳门新浦京电子游戏,例子

$str = "hello";
$pos = strpos($str, 111);
// 111的ASCII值是o,因此$pos = 4

strstr

查找字符串的首次出现,返回字符串从第一次出现的位置开始到该字符串的结尾或开始。

mixed strstr ( string $haystack , mixed $needle [, bool $before_needle = false ] )

strpos核心源码

if (Z_TYPE_P(needle) == IS_STRING) {
     if (!Z_STRLEN_P(needle)) {
          php_error_docref(NULL TSRMLS_CC, E_WARNING, "Empty needle");
          RETURN_FALSE;
     }

     // 调用php_memnstr函数查找needle
     found = php_memnstr(haystack + offset,
                            Z_STRVAL_P(needle),
                            Z_STRLEN_P(needle),
                            haystack + haystack_len);
     } else {
          // 如果不是字符串,转换成数字并赋值为该数字的ASCII字符。
          if (php_needle_char(needle, needle_char TSRMLS_CC) != SUCCESS) {
               RETURN_FALSE;
          }
          //设置结束字符
          needle_char[1] = 0;
          found = php_memnstr(haystack + offset,
                            needle_char,
                            1,
                            haystack + haystack_len);
    }
}

有一点要注意的是,如果needle不是字符串的话,会调用php_needle_char函数将needle转成整型数字并转换为其ASCII值。

参数说明

haystack
在该字符串中进行查找。
needle
如果 needle
不是一个字符串,那么它将被转换为整型并被视为字符的顺序值来使用。
before_needle
若为 TRUE,strstr() 将返回 needle 在 haystack 中的位置之前的部分。

查找函数

函数最后返回的是found,php_memnstr函数实现了查找的方法。那么再继续看看php_memnstr函数做了什么:

#define php_memnstr zend_memnstr

php_memnstr是函数zend_memnstr的宏定义,查看zend_memnstr函数如下:

static inline char *
zend_memnstr(char *haystack, char *needle, int needle_len, char *end)
{
    char *p = haystack;
    char ne = needle[needle_len-1];
    if (needle_len == 1) {
        return (char *)memchr(p, *needle, (end-p));
    }

    if (needle_len > end-haystack) {
        return NULL;
    }

    // 第一个优化,只查找end - needle_len次
    end -= needle_len;

    while (p <= end) {
        // 第二个优化,先判断字符串的开头和结尾是否一样再判断整个字符串
        if ((p = (char *)memchr(p, *needle, (end-p+1))) && ne == p[needle_len-1]) {
            if (!memcmp(needle, p, needle_len-1)) {
                return p;
            }
        }

        if (p == NULL) {
            return NULL;
        }

        p++;
    }

    return NULL;
}

第一个优化,因为(char *)memchr(p, *needle, (end-p+1)是在end –
needle_len +
1(即haystack_len+1)中查找,如果p为空,说明needle的第一个字符在p中从未出现过。

返回值

成功:返回字符串 needle 之前或之后的一部分
失败:如果没找到 needle,将返回 FALSE。

strstr

string strstr ( string $haystack, mixed $needle [, bool $before_needle = false ] ) 返回needle在haystack中第一次出现的位置到结束的字符串。

这个函数的区分大小写的。

如果needle在haystack中不存在,返回FALSE。

如果before_needle为true,则返回haystack中needle在haystack第一次出现的位置之前的字符串。

注意

  1. 该函数区分大小写
  2. 如果你仅仅想确定 needle 是否存在于 haystack
    中,请使用速度更快、耗费内存更少的 strpos() 函数

strstr核心源码

if (found) {
        // 计算出found的位置
        found_offset = found - haystack;
        if (part) {
            RETURN_STRINGL(haystack, found_offset, 1);
        } else {
            RETURN_STRINGL(found, haystack_len - found_offset, 1);
        }
}

strstr函数的前半部分跟strpos类似,区别在于strstr函数在找到位置后,需要返回haystack部分的字符串。part变量就是调用strstr函数时传递的before_needle变量。

示例

<?php
/*【 needle 为单个字符 】 */
$email  = 'name@example.com';
$domain = strstr($email, '@');
echo $domain; // 打印 @example.com

$user = strstr($email, '@', true); // 从 PHP 5.3.0 起
echo $user; // 打印 name
?>

<?php
/*【 needle 为数字 】 */
$email  = 'name@example.com'; //字母a的 ASCII码为 97
$behind = strstr($email, 97);
echo $behind; // 打印 ame@example.com

$front = strstr($email, 97, true); // 从 PHP 5.3.0 起
echo $front; // 打印 n
?>

<?php
/*【 needle 为字符串 】 */
$email = 'name@example.com';
$behind  = strstr($email, 'ex');
echo $behind; // 打印 example.com

$front = strstr($email, 'ex', true); // 从 PHP 5.3.0 起
echo $front; // 打印 name@
*/
?>

<?php
/*【 needle 为字符串 】 */
$email = 'name@example.com';
$behind  = strstr($email, 'ab');
echo $behind; // 返回 false

$front = strstr($email, 'ab', true); // 从 PHP 5.3.0 起
echo $front; // 返回 false
*/
?>

stripos

mixed stripos ( string $haystack, string $needle [, int $offset = 0 ] ) 不区分大小写的strpos。实现方式跟下面的类似,主要是使用一份拷贝然后将需要比较的字符串转换成小写字符后进行再进行查找。

stristr

strstr() 函数的忽略大小写版本

mixed stristr ( string $haystack , mixed $needle [, bool $before_needle = false ] )

该函数与 strstr() 唯一的区别就是不区分大小写。其他可参考strstr()

<?php
$email  = 'name@example.com';
$behind = stristr($email, 'A');
echo $behind; // 打印 ame@example.com

$front = stristr($email, 'A', true); // 从 PHP 5.3.0 起
echo $front; // 打印 n
?>

stristr

string stristr ( string $haystack, mixed $needle [, bool $before_needle = false ] ) 不区分大小写的strstr。

strchr

strstr() 函数的别名

mixed strchr ( string $haystack , mixed $needle [, bool $before_needle = false ] )

该函数等同 strstr() 。其他可参考strstr()

$email  = 'name@example.com';
$behind = strchr($email, 'a');
echo $behind; // 打印 ame@example.com

$front = strchr($email, 'a', true); // 从 PHP 5.3.0 起
echo $front; // 打印 n
?>

核心源码

// 拷贝一份haystack
haystack_dup = estrndup(haystack, haystack_len);

if (Z_TYPE_P(needle) == IS_STRING) {
    char *orig_needle;
    if (!Z_STRLEN_P(needle)) {
        php_error_docref(NULL TSRMLS_CC, E_WARNING, "Empty needle");
        efree(haystack_dup);
        RETURN_FALSE;
    }
    orig_needle = estrndup(Z_STRVAL_P(needle), Z_STRLEN_P(needle));
    // 调用php_stristr函数找出orig_needle的值。
    found = php_stristr(haystack_dup, orig_needle,    haystack_len, Z_STRLEN_P(needle));
    efree(orig_needle);
} else {
    if (php_needle_char(needle, needle_char TSRMLS_CC) != SUCCESS) {
        efree(haystack_dup);
        RETURN_FALSE;
    }
    needle_char[1] = 0;

    found = php_stristr(haystack_dup, needle_char,    haystack_len, 1);
}

if (found) {
    found_offset = found - haystack_dup;
    if (part) {
        RETVAL_STRINGL(haystack, found_offset, 1);
    } else {
        RETVAL_STRINGL(haystack + found_offset, haystack_len - found_offset, 1);
    }
} else {
    RETVAL_FALSE;
}

// 释放变量
efree(haystack_dup);

可以知道,found是从php_stristr中得到的,继续查看php_stristr函数:

PHPAPI char *php_stristr(char *s, char *t, size_t s_len, size_t t_len)
{
    php_strtolower(s, s_len);
    php_strtolower(t, t_len);
    return php_memnstr(s, t, t_len, s + s_len);
} 这个函数的功能就是将字符串都转成小写之后调用php_mennstr函数来查找needle在haystack第一次出现的位置。

strrchr

查找字符串的最后一次出现,返回字符串从最后一次出现的位置开始到该字符串的结尾。

mixed strrchr ( string $haystack , mixed $needle )

总结

因为strpos/stripos返回的是位置,位置从0开始计算,所以判断查找失败都用=== FALSE更适合。

阅读PHP的源码收获挺多,一方面可以知道某个函数的具体实现原理是怎样的,另一方面可以学习到一些编程优化方案。

到此本文结束,如果还有什么疑问或者建议,可以多多交流,原创文章,文笔有限,才疏学浅,文中若有不正之处,万望告知。

参数说明

haystack
在该字符串中进行查找。
needle
如果 needle 包含了不止一个字符,那么仅使用第一个字符。该行为不同于
strstr()
如果 needle 不是一个字符串,那么将被转化为整型并被视为字符顺序值。

返回值

成功:返回字符串 needle 之后的一部分
失败:如果没找到 needle,将返回 FALSE。

示例

<?php
/*【 needle 为字符 】 */
$email  = 'name@example.com';
$behind = strrchr($email, 'a');
echo $behind; // 打印 ample.com
?>

/*【 needle 为字符串 】 */
$email  = 'name@example.com';
$behind = strrchr($email, 'am');
echo $behind; // 打印 ample.com
?>

<?php
/*【 needle 为数字 】 */
$email  = 'name@example.com';
$behind = strrchr($email, 97);
echo $behind; // 打印 ample.com
?>

OneAPM for
PHP
能够深入到所有 PHP
应用内部完成应用性能管理
能够深入到所有 PHP
应用内部完成应用性能管理和监控,包括代码级别性能问题的可见性、性能瓶颈的快速识别与追溯、真实用户体验监控、服务器监控和端到端的应用性能管理。想阅读更多技术文章,请访问
OneAPM
官方技术博客。

本文转自 OneAPM
官方博客

发表评论

电子邮件地址不会被公开。 必填项已用*标注