Mb substr



В этой статье мы рассмотрим несколько различных способов в PHP обрезать строку на определенное количество слов и символов. Большая часть функций, описанных в этой статье, используется, чтобы продемонстрировать возможности PHP для работы со строками.

Во всех наших примерах мы будем использовать следующую строку, и будем исходить из того, что нам нужно уменьшить количество символов в строке со 187 до 120 символов (для Twitter).

В нашем примере мы также используем вторую строку из 55 символов, чтобы вы могли проверить возвращаемый результат на более короткой строке.

mb_strimwidth()

mb_strimwidth() возвращает в PHP обрезанную строку по длине и добавляет конечные символы, указанные в функции. Так как это одна из основных функций PHP, ее мы рассмотрим в первую очередь. Применяется она очень просто:


Функция рассматривает свободное пространство как символ. Но это значит, что между последним усеченным символом и конечным символом многоточием будет размещаться пробел. Вы можете обрезать строку без конечного символа, а затем добавить его отдельно. Посмотрите на следующий пример:

Приведенный выше код добавляет многоточие не зависимо от того, была ли PHP обрезана строка до символа или нет. Чтобы исправить это, мы будем рассчитывать длину строки, и только после этого добавлять многоточие, если исходная строка действительно должна обрезаться. Например:

При отправке сообщений в Twitter и на другие ресурсы, где символы чувствительны к регистру, каждый символ имеет значение… и эта функция в ряде случаев сэкономит вам один пробел!

mb_substr()

Функция PHP mb_substr() «получает часть строки«. Она возвращает подстроку на основе количества символов. Позиция обрезки отсчитывается от начала строки. Позиция первого символа равна 0. Позиция второго символа равна 1. И так далее.

Чтобы добавить многоточие (или любой другой конечный символ), мы можем изменить первую функцию, которую рассматривали. Мы обрезаем строку перед добавлением $trimmarker, чтобы гарантировать, что у нас не будет добавляться в PHP обрезанной строке с конца лишний пробел.

mb_substr(), substr() и mb_strcut()

mb_substr(), substr() и mb_strcut() — еще несколько функций, похожих на те, которые я описал выше. Они отличаются только тем, как обрабатываются многобайтовые наборы символов (китайский язык и т.д.).


Если вы выводите PHP обрезанную часть строки до ближайшего слова на основе количества символов (но без конечного многоточия), используйте следующий код:

preg_match()

Вы редко найдете тех, кто предпочитает использовать регулярные выражения, когда есть так много отличных функций PHP. Тем не менее, вот функция, которая обрезает строку до определенного символа в PHP, исходя из заданного количества знаков от начала. В отличие от других функций, описанных выше, эта функция обрезает строку до целого слова.

Описание функции

Функция принимает три параметра: $string, $length и $trimmarker (многоточие или другие символы, которые добавляются в конце строки).

Строка 7

Первое, что мы делаем, это проверяем длину PHP обрезанной строки после символа. Если строка короче, чем $length, то мы возвращаем эту строку.

Строка 9

Функция mb_substr() прерывает строку в $length, если это количество символов не содержит окончания слова (пробела). Если мы передали строку длиною 500 символов и эта строка не содержит пробелов, то будет возвращена вся строка (так как функция preg_match не нашла окончания слова). На данный момент мы обрезаем строку таким образом, и возвращаем ее полностью.

Строки 10, 11, и 12

Если длина нашей строки превышает максимальную длину, определенную в качестве параметра функции, мы выполняем регулярное выражение функции preg_match(), чтобы вернуть часть строки до символа с номером $length, который определяется как конец слова (‘/^.{1,$length}b/s’).


ак периода означает любой символ, кроме символа новой строки (n). Фигурная скобка определяет диапазон, который задает, сколько символов должен PHP обрезать в строке. Таким образом {1,$length} означает от 1 до символа $length. Наконец, b означает, что шаблон будет соответствовать окончанию слова. Мы можем производить поиск только слов целиком по шаблону, который мы предоставили. И в конце s задает поиск всех пробелов.

Так как мы не хотим, чтобы возвращаемая строка превышала длину $length, максимальное количество символов в функции preg_match должно быть равно максимальной длине минус длина $trimmarke.r. Мы должны учитывать это.

Затем мы возвращаем либо усеченную строку, либо исходную строку, если она меньше заданной длины усечения.

strrpos()

Функция strrpos() находит позицию последнего вхождения подстроки в строке. Она возвращает позицию, на которой располагается искомая подстрока относительно начала строки. Отметим также, что первая позиция в строке имеет номер 0 — а не 1, поэтому мы учитываем это в функции, добавляя 1 к длине строки при применении функции strrpos().

wordwrap()

Использование wordwrap() — это еще один способ, с помощью которого можно в PHP обрезать строку до пробела, хотя он не очень эффективен и не является лучшим выбором (если только обстоятельства не требуют этого). Wordwrap оборачивает строку в заданное число символов с использованием символа разрыва строки. Применив функцию PHP explode(), мы можем построить массив из каждой строки текста. Мы определяем, нужен ли $trimmarker (конечное многоточие), запросив, пусто ли второе значение массива. Если пусто, то строка не оборачивается.


Определение для параметра cut значения true означает, что строка всегда оборачивается до или на указанном символе.

str-split()

Функция str-split() может быть использована в приведенной выше функции для преобразования строки в массив. str-split () не разбивает строку до целого слова. С ее помощью PHP обрезает последний символ в строке ровно до 120 знаков.

Усечение по заданному количеству слов

Ниже приведен пример PHP обрезки строки по количеству символов, пробелов или слов. Это не слишком отличается от того, что мы уже делали. Затем мы сводим скорректированный массив в строку символов, максимальное количество которых задается $limit. Мы добавляем $trimmarker (…), если наш $limit меньше, чем количество слов в массиве.

strtok()

Совместно применив strtok() и wordwrap() мы можем создать короткую, но эффективную функцию, которая будет в PHP обрезать строку до нужной длины. Как показано ниже, она не будет учитывать при усечении $length +$trimmarker. Но это удобно, если вы не слишком заботитесь о длине возвращаемой строки.

Обрезка слов в WordPress

Для возврата обрезанного слова в WordPress используется wp_trim_words. Данная функция часто применяется в сочетании с wp_strip_all_tags для очистки текста до его обработки. Конечно, есть и другие функции, которые служат для той же цели.


Заключение

Мы могли бы написать еще сотни примеров PHP обрезки строк, но когда-то нужно остановиться. Функции, приведенные в этой статье, являются частью ядра PHP, и вы можете использовать их для усечения строк. Хотя чаще всего программисты стараются избегать регулярных выражений, если другого выхода нет, вы можете прибегнуть и к их помощи.

В ряде примеров мы вернули $trimmarker, представляющий собой многоточие. При необходимости вы можете вернуть HTML-объект Ellipsis, для этого используется код …. Но лично я предпочитаю многоточие.

www.internet-technologies.ru

Я анализирую содержимое веб-страницы с помощью file_get_content() а затем получаю из него открытый текст.


Теперь я хочу поймать первые 150 символов из этого открытого текста. Здесь я работал.

  • Это регулярное выражение отключает последнее слово в строке, хотя strlen находится в допустимом диапазоне
  • Подсчет слов в PHP
  • substr_count не работает с новыми строками?
  • Использование PHP substr () и strip_tags () при сохранении форматирования и без нарушения HTML

  • Substr от конца строки php?

DEMo на кодовом коде: DEMO

 $data = file_get_contents($url); $content = plaintext($data); //dont bother about this it works fine $Preview = trim_display(140,$content); function trim_display($size,$string) { $trim_string = mb_substr($string, 0, 150,'UTF-8'); echo "<br/> here"; echo utf8_decode($trim_string); return $trim_string; } 

Ошибка, указанная в кодеке:

Предупреждение: file_get_contents ( http://crewow.com/CSS_Layout_Tutorial.php ): не удалось открыть поток: нет такого файла или каталога в строке 3


Неустранимая ошибка: вызов неопределенной функции mb_substr () в строке 9

ruphp.com

Обрезаем текст с помощью функции substr PHP

Функция substr ( $string, $start, $length ) , где $string — это переменная с текстом, $start — это символ, с которого начинается отсчёт (за первый символ берётся 0), а $length — это количество символов выделенного текста.

$text = "Example and text";    $first = substr($text,0,6); // Показывает 6 символов начиная с 0-ого, самого первого  echo $first; // выведет 'Example'.     $second = substr($text,8,3); // Показывает 3 символа начиная с 8-ого  echo $second; // выведет 'and'

Если не указать параметр Количество символов (2 цифра), то функция выведет все оставшиеся символы


$text = "Example and text";    $third = substr($text,8); // Покажет ВСЕ символы начиная с 8-ого  echo $third; // выведет 'and text'

Обрезаем Русский текст с помощью функции mb_substr PHP

Функция mb_substr выполняет те же самые задачи, что и substr, но также способна обрабатывать многобайтные кодировки. Поэтому в случае с русским текстом Вам пригодится именно mb_substr. Работает так же

$text = "Пример текста";    $first = mb_substr($text,0,6,'UTF-8'); // Показывает 6 символов начиная с 0-ого, самого первого  // Внимание! Указывайте кодировку исходного текста! В данном случае utf-8  echo $first; //выведет 'Пример'    $second = mb_substr($text,7,6,'UTF-8'); // Показывает 6 символов начиная с 7-ого  echo $second; // выведет 'текста'

Обратите внимание на то, что в случае с кириллицей (русский текст) лучше указывать кодировку в конце функции. В примере использован самый популярный вариант — UTF-8

Обрезаем текст с конца


Если Вы хотите обрезать текст с конца, то для этого укажем отрицательное число для переменной, обозначающей с какого символа начинается вычленение текста

$text = "Sprite and Fanta";    $first = substr($text,-6,5); // Показывает 5 символов начиная с 6-ого с конца  echo $first; //выведет 'Fant'

После обрезки ещё и дописываем текст

После обрезки переменной с текстом дописываем в конец дополнительный текст

$example = "Text text text text";    $example = substr($example,0,9); // Показывает 9 символов начиная с 0-ого, самого первого  $example .= " more...";  echo $example; //выведет 'Text text more...'

Можно наоборот, запись сделать в начале, а потом уже обрезанный текст

$text = "Uncle ";    $example = "George and Michael";  $example = substr($example,0,6); // Показывает 6 символов начиная с 0-ого, самого первого  $text .= $example;  echo $text; //выведет 'Uncle George'

Обрезка текста до первого пробела

$text = 'Hello world!';  echo substr($text, 0, strpos($text, ' ' )); // Выведет 'Hello'

Готовая функция PHP обрезки текста по Словам PHP

function cut($string, $length){  $string = mb_substr($string, 0, $length,'UTF-8'); // обрезаем и работаем со всеми кодировками и указываем исходную кодировку  $position = mb_strrpos($string, ' ', 'UTF-8'); // определение позиции последнего пробела. Именно по нему и разделяем слова  $string = mb_substr($string, 0, $position, 'UTF-8'); // Обрезаем переменную по позиции  return $string;  }    $text = 'Северная война закончилась в 1721 году';  echo cut($text, 17); // выведет 'Северная война', без части слова 'закончилась'  

Можно обрезать по словам через массив…

$text = 'Microsoft был основан Биллом Гейтсом ещё в далёком 1975 году.';     $array = explode(" ",$text); // перерабатываем строку в массив  $array = array_slice($array,0,5); // выбираем первые 5 слов-элементов  $newtext = implode(" ",$array); // массив снова перерабатываем в строку     echo $newtext;//Выведет 'Microsoft был основан Биллом Гейтсом'

tradebenefit.ru


You May Also Like

About the Author: admind

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.