third_party/jinja2/lexer.py

e31aef6aSopenharmony_ci"""Implements a Jinja / Python combination lexer. The ``Lexer`` class
e31aef6aSopenharmony_ciis used to do some preprocessing. It filters out invalid operators like
e31aef6aSopenharmony_cithe bitshift operators we don't allow in templates. It separates
e31aef6aSopenharmony_citemplate code and python code in expressions.
e31aef6aSopenharmony_ci"""
e31aef6aSopenharmony_ciimport re
e31aef6aSopenharmony_ciimport typing as t
e31aef6aSopenharmony_cifrom ast import literal_eval
e31aef6aSopenharmony_cifrom collections import deque
e31aef6aSopenharmony_cifrom sys import intern
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_cifrom ._identifier import pattern as name_re
e31aef6aSopenharmony_cifrom .exceptions import TemplateSyntaxError
e31aef6aSopenharmony_cifrom .utils import LRUCache
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ciif t.TYPE_CHECKING:
e31aef6aSopenharmony_ci    import typing_extensions as te
e31aef6aSopenharmony_ci    from .environment import Environment
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci# cache for the lexers. Exists in order to be able to have multiple
e31aef6aSopenharmony_ci# environments with the same lexer
e31aef6aSopenharmony_ci_lexer_cache: t.MutableMapping[t.Tuple, "Lexer"] = LRUCache(50)  # type: ignore
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci# static regular expressions
e31aef6aSopenharmony_ciwhitespace_re = re.compile(r"\s+")
e31aef6aSopenharmony_cinewline_re = re.compile(r"(\r\n|\r|\n)")
e31aef6aSopenharmony_cistring_re = re.compile(
e31aef6aSopenharmony_ci    r"('([^'\\]*(?:\\.[^'\\]*)*)'" r'|"([^"\\]*(?:\\.[^"\\]*)*)")', re.S
e31aef6aSopenharmony_ci)
e31aef6aSopenharmony_ciinteger_re = re.compile(
e31aef6aSopenharmony_ci    r"""
e31aef6aSopenharmony_ci    (
e31aef6aSopenharmony_ci        0b(_?[0-1])+ # binary
e31aef6aSopenharmony_ci    |
e31aef6aSopenharmony_ci        0o(_?[0-7])+ # octal
e31aef6aSopenharmony_ci    |
e31aef6aSopenharmony_ci        0x(_?[\da-f])+ # hex
e31aef6aSopenharmony_ci    |
e31aef6aSopenharmony_ci        [1-9](_?\d)* # decimal
e31aef6aSopenharmony_ci    |
e31aef6aSopenharmony_ci        0(_?0)* # decimal zero
e31aef6aSopenharmony_ci    )
e31aef6aSopenharmony_ci    """,
e31aef6aSopenharmony_ci    re.IGNORECASE | re.VERBOSE,
e31aef6aSopenharmony_ci)
e31aef6aSopenharmony_cifloat_re = re.compile(
e31aef6aSopenharmony_ci    r"""
e31aef6aSopenharmony_ci    (?<!\.)  # doesn't start with a .
e31aef6aSopenharmony_ci    (\d+_)*\d+  # digits, possibly _ separated
e31aef6aSopenharmony_ci    (
e31aef6aSopenharmony_ci        (\.(\d+_)*\d+)?  # optional fractional part
e31aef6aSopenharmony_ci        e[+\-]?(\d+_)*\d+  # exponent part
e31aef6aSopenharmony_ci    |
e31aef6aSopenharmony_ci        \.(\d+_)*\d+  # required fractional part
e31aef6aSopenharmony_ci    )
e31aef6aSopenharmony_ci    """,
e31aef6aSopenharmony_ci    re.IGNORECASE | re.VERBOSE,
e31aef6aSopenharmony_ci)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci# internal the tokens and keep references to them
e31aef6aSopenharmony_ciTOKEN_ADD = intern("add")
e31aef6aSopenharmony_ciTOKEN_ASSIGN = intern("assign")
e31aef6aSopenharmony_ciTOKEN_COLON = intern("colon")
e31aef6aSopenharmony_ciTOKEN_COMMA = intern("comma")
e31aef6aSopenharmony_ciTOKEN_DIV = intern("div")
e31aef6aSopenharmony_ciTOKEN_DOT = intern("dot")
e31aef6aSopenharmony_ciTOKEN_EQ = intern("eq")
e31aef6aSopenharmony_ciTOKEN_FLOORDIV = intern("floordiv")
e31aef6aSopenharmony_ciTOKEN_GT = intern("gt")
e31aef6aSopenharmony_ciTOKEN_GTEQ = intern("gteq")
e31aef6aSopenharmony_ciTOKEN_LBRACE = intern("lbrace")
e31aef6aSopenharmony_ciTOKEN_LBRACKET = intern("lbracket")
e31aef6aSopenharmony_ciTOKEN_LPAREN = intern("lparen")
e31aef6aSopenharmony_ciTOKEN_LT = intern("lt")
e31aef6aSopenharmony_ciTOKEN_LTEQ = intern("lteq")
e31aef6aSopenharmony_ciTOKEN_MOD = intern("mod")
e31aef6aSopenharmony_ciTOKEN_MUL = intern("mul")
e31aef6aSopenharmony_ciTOKEN_NE = intern("ne")
e31aef6aSopenharmony_ciTOKEN_PIPE = intern("pipe")
e31aef6aSopenharmony_ciTOKEN_POW = intern("pow")
e31aef6aSopenharmony_ciTOKEN_RBRACE = intern("rbrace")
e31aef6aSopenharmony_ciTOKEN_RBRACKET = intern("rbracket")
e31aef6aSopenharmony_ciTOKEN_RPAREN = intern("rparen")
e31aef6aSopenharmony_ciTOKEN_SEMICOLON = intern("semicolon")
e31aef6aSopenharmony_ciTOKEN_SUB = intern("sub")
e31aef6aSopenharmony_ciTOKEN_TILDE = intern("tilde")
e31aef6aSopenharmony_ciTOKEN_WHITESPACE = intern("whitespace")
e31aef6aSopenharmony_ciTOKEN_FLOAT = intern("float")
e31aef6aSopenharmony_ciTOKEN_INTEGER = intern("integer")
e31aef6aSopenharmony_ciTOKEN_NAME = intern("name")
e31aef6aSopenharmony_ciTOKEN_STRING = intern("string")
e31aef6aSopenharmony_ciTOKEN_OPERATOR = intern("operator")
e31aef6aSopenharmony_ciTOKEN_BLOCK_BEGIN = intern("block_begin")
e31aef6aSopenharmony_ciTOKEN_BLOCK_END = intern("block_end")
e31aef6aSopenharmony_ciTOKEN_VARIABLE_BEGIN = intern("variable_begin")
e31aef6aSopenharmony_ciTOKEN_VARIABLE_END = intern("variable_end")
e31aef6aSopenharmony_ciTOKEN_RAW_BEGIN = intern("raw_begin")
e31aef6aSopenharmony_ciTOKEN_RAW_END = intern("raw_end")
e31aef6aSopenharmony_ciTOKEN_COMMENT_BEGIN = intern("comment_begin")
e31aef6aSopenharmony_ciTOKEN_COMMENT_END = intern("comment_end")
e31aef6aSopenharmony_ciTOKEN_COMMENT = intern("comment")
e31aef6aSopenharmony_ciTOKEN_LINESTATEMENT_BEGIN = intern("linestatement_begin")
e31aef6aSopenharmony_ciTOKEN_LINESTATEMENT_END = intern("linestatement_end")
e31aef6aSopenharmony_ciTOKEN_LINECOMMENT_BEGIN = intern("linecomment_begin")
e31aef6aSopenharmony_ciTOKEN_LINECOMMENT_END = intern("linecomment_end")
e31aef6aSopenharmony_ciTOKEN_LINECOMMENT = intern("linecomment")
e31aef6aSopenharmony_ciTOKEN_DATA = intern("data")
e31aef6aSopenharmony_ciTOKEN_INITIAL = intern("initial")
e31aef6aSopenharmony_ciTOKEN_EOF = intern("eof")
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci# bind operators to token types
e31aef6aSopenharmony_cioperators = {
e31aef6aSopenharmony_ci    "+": TOKEN_ADD,
e31aef6aSopenharmony_ci    "-": TOKEN_SUB,
e31aef6aSopenharmony_ci    "/": TOKEN_DIV,
e31aef6aSopenharmony_ci    "//": TOKEN_FLOORDIV,
e31aef6aSopenharmony_ci    "*": TOKEN_MUL,
e31aef6aSopenharmony_ci    "%": TOKEN_MOD,
e31aef6aSopenharmony_ci    "**": TOKEN_POW,
e31aef6aSopenharmony_ci    "~": TOKEN_TILDE,
e31aef6aSopenharmony_ci    "[": TOKEN_LBRACKET,
e31aef6aSopenharmony_ci    "]": TOKEN_RBRACKET,
e31aef6aSopenharmony_ci    "(": TOKEN_LPAREN,
e31aef6aSopenharmony_ci    ")": TOKEN_RPAREN,
e31aef6aSopenharmony_ci    "{": TOKEN_LBRACE,
e31aef6aSopenharmony_ci    "}": TOKEN_RBRACE,
e31aef6aSopenharmony_ci    "==": TOKEN_EQ,
e31aef6aSopenharmony_ci    "!=": TOKEN_NE,
e31aef6aSopenharmony_ci    ">": TOKEN_GT,
e31aef6aSopenharmony_ci    ">=": TOKEN_GTEQ,
e31aef6aSopenharmony_ci    "<": TOKEN_LT,
e31aef6aSopenharmony_ci    "<=": TOKEN_LTEQ,
e31aef6aSopenharmony_ci    "=": TOKEN_ASSIGN,
e31aef6aSopenharmony_ci    ".": TOKEN_DOT,
e31aef6aSopenharmony_ci    ":": TOKEN_COLON,
e31aef6aSopenharmony_ci    "|": TOKEN_PIPE,
e31aef6aSopenharmony_ci    ",": TOKEN_COMMA,
e31aef6aSopenharmony_ci    ";": TOKEN_SEMICOLON,
e31aef6aSopenharmony_ci}
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_cireverse_operators = {v: k for k, v in operators.items()}
e31aef6aSopenharmony_ciassert len(operators) == len(reverse_operators), "operators dropped"
e31aef6aSopenharmony_cioperator_re = re.compile(
e31aef6aSopenharmony_ci    f"({'|'.join(re.escape(x) for x in sorted(operators, key=lambda x: -len(x)))})"
e31aef6aSopenharmony_ci)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ciignored_tokens = frozenset(
e31aef6aSopenharmony_ci    [
e31aef6aSopenharmony_ci        TOKEN_COMMENT_BEGIN,
e31aef6aSopenharmony_ci        TOKEN_COMMENT,
e31aef6aSopenharmony_ci        TOKEN_COMMENT_END,
e31aef6aSopenharmony_ci        TOKEN_WHITESPACE,
e31aef6aSopenharmony_ci        TOKEN_LINECOMMENT_BEGIN,
e31aef6aSopenharmony_ci        TOKEN_LINECOMMENT_END,
e31aef6aSopenharmony_ci        TOKEN_LINECOMMENT,
e31aef6aSopenharmony_ci    ]
e31aef6aSopenharmony_ci)
e31aef6aSopenharmony_ciignore_if_empty = frozenset(
e31aef6aSopenharmony_ci    [TOKEN_WHITESPACE, TOKEN_DATA, TOKEN_COMMENT, TOKEN_LINECOMMENT]
e31aef6aSopenharmony_ci)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_cidef _describe_token_type(token_type: str) -> str:
e31aef6aSopenharmony_ci    if token_type in reverse_operators:
e31aef6aSopenharmony_ci        return reverse_operators[token_type]
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    return {
e31aef6aSopenharmony_ci        TOKEN_COMMENT_BEGIN: "begin of comment",
e31aef6aSopenharmony_ci        TOKEN_COMMENT_END: "end of comment",
e31aef6aSopenharmony_ci        TOKEN_COMMENT: "comment",
e31aef6aSopenharmony_ci        TOKEN_LINECOMMENT: "comment",
e31aef6aSopenharmony_ci        TOKEN_BLOCK_BEGIN: "begin of statement block",
e31aef6aSopenharmony_ci        TOKEN_BLOCK_END: "end of statement block",
e31aef6aSopenharmony_ci        TOKEN_VARIABLE_BEGIN: "begin of print statement",
e31aef6aSopenharmony_ci        TOKEN_VARIABLE_END: "end of print statement",
e31aef6aSopenharmony_ci        TOKEN_LINESTATEMENT_BEGIN: "begin of line statement",
e31aef6aSopenharmony_ci        TOKEN_LINESTATEMENT_END: "end of line statement",
e31aef6aSopenharmony_ci        TOKEN_DATA: "template data / text",
e31aef6aSopenharmony_ci        TOKEN_EOF: "end of template",
e31aef6aSopenharmony_ci    }.get(token_type, token_type)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_cidef describe_token(token: "Token") -> str:
e31aef6aSopenharmony_ci    """Returns a description of the token."""
e31aef6aSopenharmony_ci    if token.type == TOKEN_NAME:
e31aef6aSopenharmony_ci        return token.value
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    return _describe_token_type(token.type)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_cidef describe_token_expr(expr: str) -> str:
e31aef6aSopenharmony_ci    """Like `describe_token` but for token expressions."""
e31aef6aSopenharmony_ci    if ":" in expr:
e31aef6aSopenharmony_ci        type, value = expr.split(":", 1)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        if type == TOKEN_NAME:
e31aef6aSopenharmony_ci            return value
e31aef6aSopenharmony_ci    else:
e31aef6aSopenharmony_ci        type = expr
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    return _describe_token_type(type)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_cidef count_newlines(value: str) -> int:
e31aef6aSopenharmony_ci    """Count the number of newline characters in the string.  This is
e31aef6aSopenharmony_ci    useful for extensions that filter a stream.
e31aef6aSopenharmony_ci    """
e31aef6aSopenharmony_ci    return len(newline_re.findall(value))
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_cidef compile_rules(environment: "Environment") -> t.List[t.Tuple[str, str]]:
e31aef6aSopenharmony_ci    """Compiles all the rules from the environment into a list of rules."""
e31aef6aSopenharmony_ci    e = re.escape
e31aef6aSopenharmony_ci    rules = [
e31aef6aSopenharmony_ci        (
e31aef6aSopenharmony_ci            len(environment.comment_start_string),
e31aef6aSopenharmony_ci            TOKEN_COMMENT_BEGIN,
e31aef6aSopenharmony_ci            e(environment.comment_start_string),
e31aef6aSopenharmony_ci        ),
e31aef6aSopenharmony_ci        (
e31aef6aSopenharmony_ci            len(environment.block_start_string),
e31aef6aSopenharmony_ci            TOKEN_BLOCK_BEGIN,
e31aef6aSopenharmony_ci            e(environment.block_start_string),
e31aef6aSopenharmony_ci        ),
e31aef6aSopenharmony_ci        (
e31aef6aSopenharmony_ci            len(environment.variable_start_string),
e31aef6aSopenharmony_ci            TOKEN_VARIABLE_BEGIN,
e31aef6aSopenharmony_ci            e(environment.variable_start_string),
e31aef6aSopenharmony_ci        ),
e31aef6aSopenharmony_ci    ]
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    if environment.line_statement_prefix is not None:
e31aef6aSopenharmony_ci        rules.append(
e31aef6aSopenharmony_ci            (
e31aef6aSopenharmony_ci                len(environment.line_statement_prefix),
e31aef6aSopenharmony_ci                TOKEN_LINESTATEMENT_BEGIN,
e31aef6aSopenharmony_ci                r"^[ \t\v]*" + e(environment.line_statement_prefix),
e31aef6aSopenharmony_ci            )
e31aef6aSopenharmony_ci        )
e31aef6aSopenharmony_ci    if environment.line_comment_prefix is not None:
e31aef6aSopenharmony_ci        rules.append(
e31aef6aSopenharmony_ci            (
e31aef6aSopenharmony_ci                len(environment.line_comment_prefix),
e31aef6aSopenharmony_ci                TOKEN_LINECOMMENT_BEGIN,
e31aef6aSopenharmony_ci                r"(?:^|(?<=\S))[^\S\r\n]*" + e(environment.line_comment_prefix),
e31aef6aSopenharmony_ci            )
e31aef6aSopenharmony_ci        )
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    return [x[1:] for x in sorted(rules, reverse=True)]
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ciclass Failure:
e31aef6aSopenharmony_ci    """Class that raises a `TemplateSyntaxError` if called.
e31aef6aSopenharmony_ci    Used by the `Lexer` to specify known errors.
e31aef6aSopenharmony_ci    """
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def __init__(
e31aef6aSopenharmony_ci        self, message: str, cls: t.Type[TemplateSyntaxError] = TemplateSyntaxError
e31aef6aSopenharmony_ci    ) -> None:
e31aef6aSopenharmony_ci        self.message = message
e31aef6aSopenharmony_ci        self.error_class = cls
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def __call__(self, lineno: int, filename: str) -> "te.NoReturn":
e31aef6aSopenharmony_ci        raise self.error_class(self.message, lineno, filename)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ciclass Token(t.NamedTuple):
e31aef6aSopenharmony_ci    lineno: int
e31aef6aSopenharmony_ci    type: str
e31aef6aSopenharmony_ci    value: str
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def __str__(self) -> str:
e31aef6aSopenharmony_ci        return describe_token(self)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def test(self, expr: str) -> bool:
e31aef6aSopenharmony_ci        """Test a token against a token expression.  This can either be a
e31aef6aSopenharmony_ci        token type or ``'token_type:token_value'``.  This can only test
e31aef6aSopenharmony_ci        against string values and types.
e31aef6aSopenharmony_ci        """
e31aef6aSopenharmony_ci        # here we do a regular string equality check as test_any is usually
e31aef6aSopenharmony_ci        # passed an iterable of not interned strings.
e31aef6aSopenharmony_ci        if self.type == expr:
e31aef6aSopenharmony_ci            return True
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        if ":" in expr:
e31aef6aSopenharmony_ci            return expr.split(":", 1) == [self.type, self.value]
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        return False
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def test_any(self, *iterable: str) -> bool:
e31aef6aSopenharmony_ci        """Test against multiple token expressions."""
e31aef6aSopenharmony_ci        return any(self.test(expr) for expr in iterable)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ciclass TokenStreamIterator:
e31aef6aSopenharmony_ci    """The iterator for tokenstreams.  Iterate over the stream
e31aef6aSopenharmony_ci    until the eof token is reached.
e31aef6aSopenharmony_ci    """
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def __init__(self, stream: "TokenStream") -> None:
e31aef6aSopenharmony_ci        self.stream = stream
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def __iter__(self) -> "TokenStreamIterator":
e31aef6aSopenharmony_ci        return self
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def __next__(self) -> Token:
e31aef6aSopenharmony_ci        token = self.stream.current
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        if token.type is TOKEN_EOF:
e31aef6aSopenharmony_ci            self.stream.close()
e31aef6aSopenharmony_ci            raise StopIteration
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        next(self.stream)
e31aef6aSopenharmony_ci        return token
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ciclass TokenStream:
e31aef6aSopenharmony_ci    """A token stream is an iterable that yields :class:`Token`\\s.  The
e31aef6aSopenharmony_ci    parser however does not iterate over it but calls :meth:`next` to go
e31aef6aSopenharmony_ci    one token ahead.  The current active token is stored as :attr:`current`.
e31aef6aSopenharmony_ci    """
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def __init__(
e31aef6aSopenharmony_ci        self,
e31aef6aSopenharmony_ci        generator: t.Iterable[Token],
e31aef6aSopenharmony_ci        name: t.Optional[str],
e31aef6aSopenharmony_ci        filename: t.Optional[str],
e31aef6aSopenharmony_ci    ):
e31aef6aSopenharmony_ci        self._iter = iter(generator)
e31aef6aSopenharmony_ci        self._pushed: "te.Deque[Token]" = deque()
e31aef6aSopenharmony_ci        self.name = name
e31aef6aSopenharmony_ci        self.filename = filename
e31aef6aSopenharmony_ci        self.closed = False
e31aef6aSopenharmony_ci        self.current = Token(1, TOKEN_INITIAL, "")
e31aef6aSopenharmony_ci        next(self)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def __iter__(self) -> TokenStreamIterator:
e31aef6aSopenharmony_ci        return TokenStreamIterator(self)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def __bool__(self) -> bool:
e31aef6aSopenharmony_ci        return bool(self._pushed) or self.current.type is not TOKEN_EOF
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    @property
e31aef6aSopenharmony_ci    def eos(self) -> bool:
e31aef6aSopenharmony_ci        """Are we at the end of the stream?"""
e31aef6aSopenharmony_ci        return not self
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def push(self, token: Token) -> None:
e31aef6aSopenharmony_ci        """Push a token back to the stream."""
e31aef6aSopenharmony_ci        self._pushed.append(token)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def look(self) -> Token:
e31aef6aSopenharmony_ci        """Look at the next token."""
e31aef6aSopenharmony_ci        old_token = next(self)
e31aef6aSopenharmony_ci        result = self.current
e31aef6aSopenharmony_ci        self.push(result)
e31aef6aSopenharmony_ci        self.current = old_token
e31aef6aSopenharmony_ci        return result
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def skip(self, n: int = 1) -> None:
e31aef6aSopenharmony_ci        """Got n tokens ahead."""
e31aef6aSopenharmony_ci        for _ in range(n):
e31aef6aSopenharmony_ci            next(self)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def next_if(self, expr: str) -> t.Optional[Token]:
e31aef6aSopenharmony_ci        """Perform the token test and return the token if it matched.
e31aef6aSopenharmony_ci        Otherwise the return value is `None`.
e31aef6aSopenharmony_ci        """
e31aef6aSopenharmony_ci        if self.current.test(expr):
e31aef6aSopenharmony_ci            return next(self)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        return None
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def skip_if(self, expr: str) -> bool:
e31aef6aSopenharmony_ci        """Like :meth:`next_if` but only returns `True` or `False`."""
e31aef6aSopenharmony_ci        return self.next_if(expr) is not None
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def __next__(self) -> Token:
e31aef6aSopenharmony_ci        """Go one token ahead and return the old one.
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        Use the built-in :func:`next` instead of calling this directly.
e31aef6aSopenharmony_ci        """
e31aef6aSopenharmony_ci        rv = self.current
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        if self._pushed:
e31aef6aSopenharmony_ci            self.current = self._pushed.popleft()
e31aef6aSopenharmony_ci        elif self.current.type is not TOKEN_EOF:
e31aef6aSopenharmony_ci            try:
e31aef6aSopenharmony_ci                self.current = next(self._iter)
e31aef6aSopenharmony_ci            except StopIteration:
e31aef6aSopenharmony_ci                self.close()
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        return rv
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def close(self) -> None:
e31aef6aSopenharmony_ci        """Close the stream."""
e31aef6aSopenharmony_ci        self.current = Token(self.current.lineno, TOKEN_EOF, "")
e31aef6aSopenharmony_ci        self._iter = iter(())
e31aef6aSopenharmony_ci        self.closed = True
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def expect(self, expr: str) -> Token:
e31aef6aSopenharmony_ci        """Expect a given token type and return it.  This accepts the same
e31aef6aSopenharmony_ci        argument as :meth:`jinja2.lexer.Token.test`.
e31aef6aSopenharmony_ci        """
e31aef6aSopenharmony_ci        if not self.current.test(expr):
e31aef6aSopenharmony_ci            expr = describe_token_expr(expr)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci            if self.current.type is TOKEN_EOF:
e31aef6aSopenharmony_ci                raise TemplateSyntaxError(
e31aef6aSopenharmony_ci                    f"unexpected end of template, expected {expr!r}.",
e31aef6aSopenharmony_ci                    self.current.lineno,
e31aef6aSopenharmony_ci                    self.name,
e31aef6aSopenharmony_ci                    self.filename,
e31aef6aSopenharmony_ci                )
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci            raise TemplateSyntaxError(
e31aef6aSopenharmony_ci                f"expected token {expr!r}, got {describe_token(self.current)!r}",
e31aef6aSopenharmony_ci                self.current.lineno,
e31aef6aSopenharmony_ci                self.name,
e31aef6aSopenharmony_ci                self.filename,
e31aef6aSopenharmony_ci            )
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        return next(self)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_cidef get_lexer(environment: "Environment") -> "Lexer":
e31aef6aSopenharmony_ci    """Return a lexer which is probably cached."""
e31aef6aSopenharmony_ci    key = (
e31aef6aSopenharmony_ci        environment.block_start_string,
e31aef6aSopenharmony_ci        environment.block_end_string,
e31aef6aSopenharmony_ci        environment.variable_start_string,
e31aef6aSopenharmony_ci        environment.variable_end_string,
e31aef6aSopenharmony_ci        environment.comment_start_string,
e31aef6aSopenharmony_ci        environment.comment_end_string,
e31aef6aSopenharmony_ci        environment.line_statement_prefix,
e31aef6aSopenharmony_ci        environment.line_comment_prefix,
e31aef6aSopenharmony_ci        environment.trim_blocks,
e31aef6aSopenharmony_ci        environment.lstrip_blocks,
e31aef6aSopenharmony_ci        environment.newline_sequence,
e31aef6aSopenharmony_ci        environment.keep_trailing_newline,
e31aef6aSopenharmony_ci    )
e31aef6aSopenharmony_ci    lexer = _lexer_cache.get(key)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    if lexer is None:
e31aef6aSopenharmony_ci        _lexer_cache[key] = lexer = Lexer(environment)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    return lexer
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ciclass OptionalLStrip(tuple):
e31aef6aSopenharmony_ci    """A special tuple for marking a point in the state that can have
e31aef6aSopenharmony_ci    lstrip applied.
e31aef6aSopenharmony_ci    """
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    __slots__ = ()
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    # Even though it looks like a no-op, creating instances fails
e31aef6aSopenharmony_ci    # without this.
e31aef6aSopenharmony_ci    def __new__(cls, *members, **kwargs):  # type: ignore
e31aef6aSopenharmony_ci        return super().__new__(cls, members)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ciclass _Rule(t.NamedTuple):
e31aef6aSopenharmony_ci    pattern: t.Pattern[str]
e31aef6aSopenharmony_ci    tokens: t.Union[str, t.Tuple[str, ...], t.Tuple[Failure]]
e31aef6aSopenharmony_ci    command: t.Optional[str]
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ciclass Lexer:
e31aef6aSopenharmony_ci    """Class that implements a lexer for a given environment. Automatically
e31aef6aSopenharmony_ci    created by the environment class, usually you don't have to do that.
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    Note that the lexer is not automatically bound to an environment.
e31aef6aSopenharmony_ci    Multiple environments can share the same lexer.
e31aef6aSopenharmony_ci    """
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def __init__(self, environment: "Environment") -> None:
e31aef6aSopenharmony_ci        # shortcuts
e31aef6aSopenharmony_ci        e = re.escape
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        def c(x: str) -> t.Pattern[str]:
e31aef6aSopenharmony_ci            return re.compile(x, re.M | re.S)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        # lexing rules for tags
e31aef6aSopenharmony_ci        tag_rules: t.List[_Rule] = [
e31aef6aSopenharmony_ci            _Rule(whitespace_re, TOKEN_WHITESPACE, None),
e31aef6aSopenharmony_ci            _Rule(float_re, TOKEN_FLOAT, None),
e31aef6aSopenharmony_ci            _Rule(integer_re, TOKEN_INTEGER, None),
e31aef6aSopenharmony_ci            _Rule(name_re, TOKEN_NAME, None),
e31aef6aSopenharmony_ci            _Rule(string_re, TOKEN_STRING, None),
e31aef6aSopenharmony_ci            _Rule(operator_re, TOKEN_OPERATOR, None),
e31aef6aSopenharmony_ci        ]
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        # assemble the root lexing rule. because "|" is ungreedy
e31aef6aSopenharmony_ci        # we have to sort by length so that the lexer continues working
e31aef6aSopenharmony_ci        # as expected when we have parsing rules like <% for block and
e31aef6aSopenharmony_ci        # <%= for variables. (if someone wants asp like syntax)
e31aef6aSopenharmony_ci        # variables are just part of the rules if variable processing
e31aef6aSopenharmony_ci        # is required.
e31aef6aSopenharmony_ci        root_tag_rules = compile_rules(environment)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        block_start_re = e(environment.block_start_string)
e31aef6aSopenharmony_ci        block_end_re = e(environment.block_end_string)
e31aef6aSopenharmony_ci        comment_end_re = e(environment.comment_end_string)
e31aef6aSopenharmony_ci        variable_end_re = e(environment.variable_end_string)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        # block suffix if trimming is enabled
e31aef6aSopenharmony_ci        block_suffix_re = "\\n?" if environment.trim_blocks else ""
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        self.lstrip_blocks = environment.lstrip_blocks
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        self.newline_sequence = environment.newline_sequence
e31aef6aSopenharmony_ci        self.keep_trailing_newline = environment.keep_trailing_newline
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        root_raw_re = (
e31aef6aSopenharmony_ci            rf"(?P<raw_begin>{block_start_re}(\-|\+|)\s*raw\s*"
e31aef6aSopenharmony_ci            rf"(?:\-{block_end_re}\s*|{block_end_re}))"
e31aef6aSopenharmony_ci        )
e31aef6aSopenharmony_ci        root_parts_re = "|".join(
e31aef6aSopenharmony_ci            [root_raw_re] + [rf"(?P<{n}>{r}(\-|\+|))" for n, r in root_tag_rules]
e31aef6aSopenharmony_ci        )
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        # global lexing rules
e31aef6aSopenharmony_ci        self.rules: t.Dict[str, t.List[_Rule]] = {
e31aef6aSopenharmony_ci            "root": [
e31aef6aSopenharmony_ci                # directives
e31aef6aSopenharmony_ci                _Rule(
e31aef6aSopenharmony_ci                    c(rf"(.*?)(?:{root_parts_re})"),
e31aef6aSopenharmony_ci                    OptionalLStrip(TOKEN_DATA, "#bygroup"),  # type: ignore
e31aef6aSopenharmony_ci                    "#bygroup",
e31aef6aSopenharmony_ci                ),
e31aef6aSopenharmony_ci                # data
e31aef6aSopenharmony_ci                _Rule(c(".+"), TOKEN_DATA, None),
e31aef6aSopenharmony_ci            ],
e31aef6aSopenharmony_ci            # comments
e31aef6aSopenharmony_ci            TOKEN_COMMENT_BEGIN: [
e31aef6aSopenharmony_ci                _Rule(
e31aef6aSopenharmony_ci                    c(
e31aef6aSopenharmony_ci                        rf"(.*?)((?:\+{comment_end_re}|\-{comment_end_re}\s*"
e31aef6aSopenharmony_ci                        rf"|{comment_end_re}{block_suffix_re}))"
e31aef6aSopenharmony_ci                    ),
e31aef6aSopenharmony_ci                    (TOKEN_COMMENT, TOKEN_COMMENT_END),
e31aef6aSopenharmony_ci                    "#pop",
e31aef6aSopenharmony_ci                ),
e31aef6aSopenharmony_ci                _Rule(c(r"(.)"), (Failure("Missing end of comment tag"),), None),
e31aef6aSopenharmony_ci            ],
e31aef6aSopenharmony_ci            # blocks
e31aef6aSopenharmony_ci            TOKEN_BLOCK_BEGIN: [
e31aef6aSopenharmony_ci                _Rule(
e31aef6aSopenharmony_ci                    c(
e31aef6aSopenharmony_ci                        rf"(?:\+{block_end_re}|\-{block_end_re}\s*"
e31aef6aSopenharmony_ci                        rf"|{block_end_re}{block_suffix_re})"
e31aef6aSopenharmony_ci                    ),
e31aef6aSopenharmony_ci                    TOKEN_BLOCK_END,
e31aef6aSopenharmony_ci                    "#pop",
e31aef6aSopenharmony_ci                ),
e31aef6aSopenharmony_ci            ]
e31aef6aSopenharmony_ci            + tag_rules,
e31aef6aSopenharmony_ci            # variables
e31aef6aSopenharmony_ci            TOKEN_VARIABLE_BEGIN: [
e31aef6aSopenharmony_ci                _Rule(
e31aef6aSopenharmony_ci                    c(rf"\-{variable_end_re}\s*|{variable_end_re}"),
e31aef6aSopenharmony_ci                    TOKEN_VARIABLE_END,
e31aef6aSopenharmony_ci                    "#pop",
e31aef6aSopenharmony_ci                )
e31aef6aSopenharmony_ci            ]
e31aef6aSopenharmony_ci            + tag_rules,
e31aef6aSopenharmony_ci            # raw block
e31aef6aSopenharmony_ci            TOKEN_RAW_BEGIN: [
e31aef6aSopenharmony_ci                _Rule(
e31aef6aSopenharmony_ci                    c(
e31aef6aSopenharmony_ci                        rf"(.*?)((?:{block_start_re}(\-|\+|))\s*endraw\s*"
e31aef6aSopenharmony_ci                        rf"(?:\+{block_end_re}|\-{block_end_re}\s*"
e31aef6aSopenharmony_ci                        rf"|{block_end_re}{block_suffix_re}))"
e31aef6aSopenharmony_ci                    ),
e31aef6aSopenharmony_ci                    OptionalLStrip(TOKEN_DATA, TOKEN_RAW_END),  # type: ignore
e31aef6aSopenharmony_ci                    "#pop",
e31aef6aSopenharmony_ci                ),
e31aef6aSopenharmony_ci                _Rule(c(r"(.)"), (Failure("Missing end of raw directive"),), None),
e31aef6aSopenharmony_ci            ],
e31aef6aSopenharmony_ci            # line statements
e31aef6aSopenharmony_ci            TOKEN_LINESTATEMENT_BEGIN: [
e31aef6aSopenharmony_ci                _Rule(c(r"\s*(\n|$)"), TOKEN_LINESTATEMENT_END, "#pop")
e31aef6aSopenharmony_ci            ]
e31aef6aSopenharmony_ci            + tag_rules,
e31aef6aSopenharmony_ci            # line comments
e31aef6aSopenharmony_ci            TOKEN_LINECOMMENT_BEGIN: [
e31aef6aSopenharmony_ci                _Rule(
e31aef6aSopenharmony_ci                    c(r"(.*?)()(?=\n|$)"),
e31aef6aSopenharmony_ci                    (TOKEN_LINECOMMENT, TOKEN_LINECOMMENT_END),
e31aef6aSopenharmony_ci                    "#pop",
e31aef6aSopenharmony_ci                )
e31aef6aSopenharmony_ci            ],
e31aef6aSopenharmony_ci        }
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def _normalize_newlines(self, value: str) -> str:
e31aef6aSopenharmony_ci        """Replace all newlines with the configured sequence in strings
e31aef6aSopenharmony_ci        and template data.
e31aef6aSopenharmony_ci        """
e31aef6aSopenharmony_ci        return newline_re.sub(self.newline_sequence, value)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def tokenize(
e31aef6aSopenharmony_ci        self,
e31aef6aSopenharmony_ci        source: str,
e31aef6aSopenharmony_ci        name: t.Optional[str] = None,
e31aef6aSopenharmony_ci        filename: t.Optional[str] = None,
e31aef6aSopenharmony_ci        state: t.Optional[str] = None,
e31aef6aSopenharmony_ci    ) -> TokenStream:
e31aef6aSopenharmony_ci        """Calls tokeniter + tokenize and wraps it in a token stream."""
e31aef6aSopenharmony_ci        stream = self.tokeniter(source, name, filename, state)
e31aef6aSopenharmony_ci        return TokenStream(self.wrap(stream, name, filename), name, filename)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def wrap(
e31aef6aSopenharmony_ci        self,
e31aef6aSopenharmony_ci        stream: t.Iterable[t.Tuple[int, str, str]],
e31aef6aSopenharmony_ci        name: t.Optional[str] = None,
e31aef6aSopenharmony_ci        filename: t.Optional[str] = None,
e31aef6aSopenharmony_ci    ) -> t.Iterator[Token]:
e31aef6aSopenharmony_ci        """This is called with the stream as returned by `tokenize` and wraps
e31aef6aSopenharmony_ci        every token in a :class:`Token` and converts the value.
e31aef6aSopenharmony_ci        """
e31aef6aSopenharmony_ci        for lineno, token, value_str in stream:
e31aef6aSopenharmony_ci            if token in ignored_tokens:
e31aef6aSopenharmony_ci                continue
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci            value: t.Any = value_str
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci            if token == TOKEN_LINESTATEMENT_BEGIN:
e31aef6aSopenharmony_ci                token = TOKEN_BLOCK_BEGIN
e31aef6aSopenharmony_ci            elif token == TOKEN_LINESTATEMENT_END:
e31aef6aSopenharmony_ci                token = TOKEN_BLOCK_END
e31aef6aSopenharmony_ci            # we are not interested in those tokens in the parser
e31aef6aSopenharmony_ci            elif token in (TOKEN_RAW_BEGIN, TOKEN_RAW_END):
e31aef6aSopenharmony_ci                continue
e31aef6aSopenharmony_ci            elif token == TOKEN_DATA:
e31aef6aSopenharmony_ci                value = self._normalize_newlines(value_str)
e31aef6aSopenharmony_ci            elif token == "keyword":
e31aef6aSopenharmony_ci                token = value_str
e31aef6aSopenharmony_ci            elif token == TOKEN_NAME:
e31aef6aSopenharmony_ci                value = value_str
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                if not value.isidentifier():
e31aef6aSopenharmony_ci                    raise TemplateSyntaxError(
e31aef6aSopenharmony_ci                        "Invalid character in identifier", lineno, name, filename
e31aef6aSopenharmony_ci                    )
e31aef6aSopenharmony_ci            elif token == TOKEN_STRING:
e31aef6aSopenharmony_ci                # try to unescape string
e31aef6aSopenharmony_ci                try:
e31aef6aSopenharmony_ci                    value = (
e31aef6aSopenharmony_ci                        self._normalize_newlines(value_str[1:-1])
e31aef6aSopenharmony_ci                        .encode("ascii", "backslashreplace")
e31aef6aSopenharmony_ci                        .decode("unicode-escape")
e31aef6aSopenharmony_ci                    )
e31aef6aSopenharmony_ci                except Exception as e:
e31aef6aSopenharmony_ci                    msg = str(e).split(":")[-1].strip()
e31aef6aSopenharmony_ci                    raise TemplateSyntaxError(msg, lineno, name, filename) from e
e31aef6aSopenharmony_ci            elif token == TOKEN_INTEGER:
e31aef6aSopenharmony_ci                value = int(value_str.replace("_", ""), 0)
e31aef6aSopenharmony_ci            elif token == TOKEN_FLOAT:
e31aef6aSopenharmony_ci                # remove all "_" first to support more Python versions
e31aef6aSopenharmony_ci                value = literal_eval(value_str.replace("_", ""))
e31aef6aSopenharmony_ci            elif token == TOKEN_OPERATOR:
e31aef6aSopenharmony_ci                token = operators[value_str]
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci            yield Token(lineno, token, value)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci    def tokeniter(
e31aef6aSopenharmony_ci        self,
e31aef6aSopenharmony_ci        source: str,
e31aef6aSopenharmony_ci        name: t.Optional[str],
e31aef6aSopenharmony_ci        filename: t.Optional[str] = None,
e31aef6aSopenharmony_ci        state: t.Optional[str] = None,
e31aef6aSopenharmony_ci    ) -> t.Iterator[t.Tuple[int, str, str]]:
e31aef6aSopenharmony_ci        """This method tokenizes the text and returns the tokens in a
e31aef6aSopenharmony_ci        generator. Use this method if you just want to tokenize a template.
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        .. versionchanged:: 3.0
e31aef6aSopenharmony_ci            Only ``\\n``, ``\\r\\n`` and ``\\r`` are treated as line
e31aef6aSopenharmony_ci            breaks.
e31aef6aSopenharmony_ci        """
e31aef6aSopenharmony_ci        lines = newline_re.split(source)[::2]
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        if not self.keep_trailing_newline and lines[-1] == "":
e31aef6aSopenharmony_ci            del lines[-1]
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        source = "\n".join(lines)
e31aef6aSopenharmony_ci        pos = 0
e31aef6aSopenharmony_ci        lineno = 1
e31aef6aSopenharmony_ci        stack = ["root"]
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        if state is not None and state != "root":
e31aef6aSopenharmony_ci            assert state in ("variable", "block"), "invalid state"
e31aef6aSopenharmony_ci            stack.append(state + "_begin")
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        statetokens = self.rules[stack[-1]]
e31aef6aSopenharmony_ci        source_length = len(source)
e31aef6aSopenharmony_ci        balancing_stack: t.List[str] = []
e31aef6aSopenharmony_ci        newlines_stripped = 0
e31aef6aSopenharmony_ci        line_starting = True
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci        while True:
e31aef6aSopenharmony_ci            # tokenizer loop
e31aef6aSopenharmony_ci            for regex, tokens, new_state in statetokens:
e31aef6aSopenharmony_ci                m = regex.match(source, pos)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                # if no match we try again with the next rule
e31aef6aSopenharmony_ci                if m is None:
e31aef6aSopenharmony_ci                    continue
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                # we only match blocks and variables if braces / parentheses
e31aef6aSopenharmony_ci                # are balanced. continue parsing with the lower rule which
e31aef6aSopenharmony_ci                # is the operator rule. do this only if the end tags look
e31aef6aSopenharmony_ci                # like operators
e31aef6aSopenharmony_ci                if balancing_stack and tokens in (
e31aef6aSopenharmony_ci                    TOKEN_VARIABLE_END,
e31aef6aSopenharmony_ci                    TOKEN_BLOCK_END,
e31aef6aSopenharmony_ci                    TOKEN_LINESTATEMENT_END,
e31aef6aSopenharmony_ci                ):
e31aef6aSopenharmony_ci                    continue
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                # tuples support more options
e31aef6aSopenharmony_ci                if isinstance(tokens, tuple):
e31aef6aSopenharmony_ci                    groups: t.Sequence[str] = m.groups()
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                    if isinstance(tokens, OptionalLStrip):
e31aef6aSopenharmony_ci                        # Rule supports lstrip. Match will look like
e31aef6aSopenharmony_ci                        # text, block type, whitespace control, type, control, ...
e31aef6aSopenharmony_ci                        text = groups[0]
e31aef6aSopenharmony_ci                        # Skipping the text and first type, every other group is the
e31aef6aSopenharmony_ci                        # whitespace control for each type. One of the groups will be
e31aef6aSopenharmony_ci                        # -, +, or empty string instead of None.
e31aef6aSopenharmony_ci                        strip_sign = next(g for g in groups[2::2] if g is not None)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                        if strip_sign == "-":
e31aef6aSopenharmony_ci                            # Strip all whitespace between the text and the tag.
e31aef6aSopenharmony_ci                            stripped = text.rstrip()
e31aef6aSopenharmony_ci                            newlines_stripped = text[len(stripped) :].count("\n")
e31aef6aSopenharmony_ci                            groups = [stripped, *groups[1:]]
e31aef6aSopenharmony_ci                        elif (
e31aef6aSopenharmony_ci                            # Not marked for preserving whitespace.
e31aef6aSopenharmony_ci                            strip_sign != "+"
e31aef6aSopenharmony_ci                            # lstrip is enabled.
e31aef6aSopenharmony_ci                            and self.lstrip_blocks
e31aef6aSopenharmony_ci                            # Not a variable expression.
e31aef6aSopenharmony_ci                            and not m.groupdict().get(TOKEN_VARIABLE_BEGIN)
e31aef6aSopenharmony_ci                        ):
e31aef6aSopenharmony_ci                            # The start of text between the last newline and the tag.
e31aef6aSopenharmony_ci                            l_pos = text.rfind("\n") + 1
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                            if l_pos > 0 or line_starting:
e31aef6aSopenharmony_ci                                # If there's only whitespace between the newline and the
e31aef6aSopenharmony_ci                                # tag, strip it.
e31aef6aSopenharmony_ci                                if whitespace_re.fullmatch(text, l_pos):
e31aef6aSopenharmony_ci                                    groups = [text[:l_pos], *groups[1:]]
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                    for idx, token in enumerate(tokens):
e31aef6aSopenharmony_ci                        # failure group
e31aef6aSopenharmony_ci                        if token.__class__ is Failure:
e31aef6aSopenharmony_ci                            raise token(lineno, filename)
e31aef6aSopenharmony_ci                        # bygroup is a bit more complex, in that case we
e31aef6aSopenharmony_ci                        # yield for the current token the first named
e31aef6aSopenharmony_ci                        # group that matched
e31aef6aSopenharmony_ci                        elif token == "#bygroup":
e31aef6aSopenharmony_ci                            for key, value in m.groupdict().items():
e31aef6aSopenharmony_ci                                if value is not None:
e31aef6aSopenharmony_ci                                    yield lineno, key, value
e31aef6aSopenharmony_ci                                    lineno += value.count("\n")
e31aef6aSopenharmony_ci                                    break
e31aef6aSopenharmony_ci                            else:
e31aef6aSopenharmony_ci                                raise RuntimeError(
e31aef6aSopenharmony_ci                                    f"{regex!r} wanted to resolve the token dynamically"
e31aef6aSopenharmony_ci                                    " but no group matched"
e31aef6aSopenharmony_ci                                )
e31aef6aSopenharmony_ci                        # normal group
e31aef6aSopenharmony_ci                        else:
e31aef6aSopenharmony_ci                            data = groups[idx]
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                            if data or token not in ignore_if_empty:
e31aef6aSopenharmony_ci                                yield lineno, token, data
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                            lineno += data.count("\n") + newlines_stripped
e31aef6aSopenharmony_ci                            newlines_stripped = 0
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                # strings as token just are yielded as it.
e31aef6aSopenharmony_ci                else:
e31aef6aSopenharmony_ci                    data = m.group()
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                    # update brace/parentheses balance
e31aef6aSopenharmony_ci                    if tokens == TOKEN_OPERATOR:
e31aef6aSopenharmony_ci                        if data == "{":
e31aef6aSopenharmony_ci                            balancing_stack.append("}")
e31aef6aSopenharmony_ci                        elif data == "(":
e31aef6aSopenharmony_ci                            balancing_stack.append(")")
e31aef6aSopenharmony_ci                        elif data == "[":
e31aef6aSopenharmony_ci                            balancing_stack.append("]")
e31aef6aSopenharmony_ci                        elif data in ("}", ")", "]"):
e31aef6aSopenharmony_ci                            if not balancing_stack:
e31aef6aSopenharmony_ci                                raise TemplateSyntaxError(
e31aef6aSopenharmony_ci                                    f"unexpected '{data}'", lineno, name, filename
e31aef6aSopenharmony_ci                                )
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                            expected_op = balancing_stack.pop()
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                            if expected_op != data:
e31aef6aSopenharmony_ci                                raise TemplateSyntaxError(
e31aef6aSopenharmony_ci                                    f"unexpected '{data}', expected '{expected_op}'",
e31aef6aSopenharmony_ci                                    lineno,
e31aef6aSopenharmony_ci                                    name,
e31aef6aSopenharmony_ci                                    filename,
e31aef6aSopenharmony_ci                                )
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                    # yield items
e31aef6aSopenharmony_ci                    if data or tokens not in ignore_if_empty:
e31aef6aSopenharmony_ci                        yield lineno, tokens, data
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                    lineno += data.count("\n")
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                line_starting = m.group()[-1:] == "\n"
e31aef6aSopenharmony_ci                # fetch new position into new variable so that we can check
e31aef6aSopenharmony_ci                # if there is a internal parsing error which would result
e31aef6aSopenharmony_ci                # in an infinite loop
e31aef6aSopenharmony_ci                pos2 = m.end()
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                # handle state changes
e31aef6aSopenharmony_ci                if new_state is not None:
e31aef6aSopenharmony_ci                    # remove the uppermost state
e31aef6aSopenharmony_ci                    if new_state == "#pop":
e31aef6aSopenharmony_ci                        stack.pop()
e31aef6aSopenharmony_ci                    # resolve the new state by group checking
e31aef6aSopenharmony_ci                    elif new_state == "#bygroup":
e31aef6aSopenharmony_ci                        for key, value in m.groupdict().items():
e31aef6aSopenharmony_ci                            if value is not None:
e31aef6aSopenharmony_ci                                stack.append(key)
e31aef6aSopenharmony_ci                                break
e31aef6aSopenharmony_ci                        else:
e31aef6aSopenharmony_ci                            raise RuntimeError(
e31aef6aSopenharmony_ci                                f"{regex!r} wanted to resolve the new state dynamically"
e31aef6aSopenharmony_ci                                f" but no group matched"
e31aef6aSopenharmony_ci                            )
e31aef6aSopenharmony_ci                    # direct state name given
e31aef6aSopenharmony_ci                    else:
e31aef6aSopenharmony_ci                        stack.append(new_state)
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                    statetokens = self.rules[stack[-1]]
e31aef6aSopenharmony_ci                # we are still at the same position and no stack change.
e31aef6aSopenharmony_ci                # this means a loop without break condition, avoid that and
e31aef6aSopenharmony_ci                # raise error
e31aef6aSopenharmony_ci                elif pos2 == pos:
e31aef6aSopenharmony_ci                    raise RuntimeError(
e31aef6aSopenharmony_ci                        f"{regex!r} yielded empty string without stack change"
e31aef6aSopenharmony_ci                    )
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                # publish new function and start again
e31aef6aSopenharmony_ci                pos = pos2
e31aef6aSopenharmony_ci                break
e31aef6aSopenharmony_ci            # if loop terminated without break we haven't found a single match
e31aef6aSopenharmony_ci            # either we are at the end of the file or we have a problem
e31aef6aSopenharmony_ci            else:
e31aef6aSopenharmony_ci                # end of text
e31aef6aSopenharmony_ci                if pos >= source_length:
e31aef6aSopenharmony_ci                    return
e31aef6aSopenharmony_ci
e31aef6aSopenharmony_ci                # something went wrong
e31aef6aSopenharmony_ci                raise TemplateSyntaxError(
e31aef6aSopenharmony_ci                    f"unexpected char {source[pos]!r} at {pos}", lineno, name, filename
e31aef6aSopenharmony_ci                )