Регулярные выражения в Java (regexp)

Автор: content Понедельник, Апрель 9th, 2012 Нет комментариев

Рубрика: Язык Java

Регулярные выражения (Regular Expressions) позволяют сопоставлять текст с указанным шаблоном, а также выполнять замену текста. Эти операции осуществляются с помощью универсальных символов, которые специальным образом интерпретируются.
Регулярные выражения используются в большом количестве языков программирования.
В Java тоже есть пакет, который позволяет работать с ними — java.util.regex.

Пакет состоит всего из трех классов: Matcher, Pattern, PatternSyntaxException.
Pattern — скомпилированное представление регулярного выражения.
Matcher — движок, который производит операцию сравнения (match).
PatternSyntaxException — указывает на синтаксическую ошибку в выражении.
Последовательность вызова методов при работе с regexp:

Pattern p = Pattern.compile(“a*b”);
Matcher m = p.matcher(“aaab”);
boolean b = m.matches();

Как видно из примера, регулярное выражение сперва должно быть откомпилировано. Результирующий объект может быть использован для создания объекта Matcher на основе java.lang.CharSequence (String). Matcher в свою очередь вызывает метод matches().
Регулярные выражения очень полезны при server- и client-side валидации данных.
Давайте рассмотрим небольшой пример. Допустим, необходимо проверить корректность e-mail адреса.

import java.util.regex.*;

public class TestRegexp {
public static final Pattern pattern = Pattern.compile
(“[a-zA-Z]{1}[a-zA-Z\\d\\u002E\\u005F]+@([a-zA-Z]+\\u002E){1,2}((net)|(com)|(org))”);

public static void doMatch(String word) {
String output = “Validation for \“” + word + “\””
Matcher matcher = pattern.matcher(word);
if (matcher.matches())
output += “ passed.”
else
output += “ not passed.”
System.out.println(output);
}

public static void main(String[] args) {
doMatch(“c0nst@money.simply.net”);
doMatch(“somebody@dev.com.ua”);
doMatch(“Name.Sur_name@gmail.com”);
doMatch(“useR33@somewhere.in.the.net”);
}
}

Последовательность вида [a-zA-Z] указывает на множество. {n} говорит о том, что некоторый символ должен встретится n раз, а {n,m} — от n до m раз. Символ \d указывает на множество цифр. “\u002E” и “\u005F” — это символы точки и подчеркивания соответсвенно. Знак плюс после некоторой последовательности говорит о том, что она должна встретится один или более раз. “|” — представление логического “или”. Полное описание всех конструкций можно найти в Java API.
В нашем примере под Pattern будут подходить те e-mail адреса, которые начинаются с буквы, содержат буквы, цифры, точку и подчеркивание до символа “@” и находятся в доменах com, net, org (не более третьего уровня).
А вот и результат выполнения программы:

Validation for “c0nst@money.simply.net” passed.
Validation for “somebody@dev.com.ua” not passed.
Validation for “Name.Sur_name@gmail.com” passed.
Validation for “user33@somewhere.in.the.net” not passed.

это я думаю лучший способ проверки:

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class ggggg {

public static void checkEmail(String sEmail) {
String sDomen = “[a-z][a-z[0-9]\u005F\u002E\u002D]*[a-z||0-9]”;

//String sDomen2 = “([a-z]){2,4}”;
// variant two (net||org||ru||info … ||jp)
String sDomen2 = “(net||org||ru||info)”;

Pattern p = Pattern.compile(sDomen + “@” + sDomen + “\u002E” + sDomen2);
Matcher m = p.matcher(sEmail.toLowerCase());

String sResult = m.matches()?sEmail + “: passed.”:sEmail + “: not passed.”;

System.out.println(sResult);
}

public static void main(String[] args) {
// TODO Auto-generated method stub

checkEmail(”mail@mail.ru”);
checkEmail(”mail@mail.org”);
checkEmail(”mail@mail.info”);
checkEmail(”mail@mail.”);
checkEmail(”mail@mail”);
checkEmail(”»);
checkEmail(”sgfdsg”);
checkEmail(”m.a.i.l@mail.ru”);
checkEmail(”_mail@mail.ru”);
checkEmail(”mail_@mail.ru”);
checkEmail(”mail@_mail.ru”);
checkEmail(”mail@mail_.ru”);
checkEmail(”1mail@mail.ru”);
checkEmail(”mail1@mail.ru”);
checkEmail(”mail@mail1.ru”);
checkEmail(”m___ail@mail.ru”);
checkEmail(”C_fdhsfk4@mai32l.ru”);
checkEmail(”ma*il@mail.ru”);
checkEmail(”mail@ma^il.ru”);
checkEmail(”mail@mail.my.my1.ru”);
checkEmail(”@mail.my.my1.ru”);
checkEmail(”mail@mail.my.my1.u”);
checkEmail(”mail@.ru”);
checkEmail(”m l@ddd.ru”);
checkEmail(”mail@d d.r u”);
}
}
Источник: http://www.javaportal.ru/java/articles/regexp.html

Оставить комментарий

Чтобы оставлять комментарии Вы должны быть авторизованы.

Похожие посты