May 21, 2023 · Apr 19, 2023 · Apr 27, 2023 · Apr 29, 2023 · May 2, 2023 · May 2, 2023
diff --git a/Lib/test/test_tokenize.py b/Lib/test/test_tokenize.py
    OP         '{'           (1, 6) (1, 7)
    NAME       'b'           (1, 7) (1, 8)
    OP         '!'           (1, 8) (1, 9)
 FSTRING_MIDDLE 'r'           (1, 9) (1, 10)
    OP         '}'           (1, 10) (1,12)
    FSTRING_MIDDLE '}c'          (1,12) (1, 14)
 NAME 'r'           (1, 9) (1, 10)
    OP         '}'           (1, 10) (1,11)
    FSTRING_MIDDLE '}c'          (1,11) (1, 14)
    FSTRING_END '"'           (1, 14) (1, 15)
    """)
        self.check_tokenize('f"{{{1+1}}}"', """\
    NUMBER     '1'           (1, 5) (1, 6)
    OP         '+'           (1, 6) (1, 7)
    NUMBER     '1'           (1, 7) (1, 8)
    OP         '}'           (1, 8) (1,10)
    FSTRING_MIDDLE '}'           (1,10) (1, 11)
    OP         '}'           (1, 8) (1,9)
    FSTRING_MIDDLE '}'           (1,9) (1, 11)
    FSTRING_END '"'           (1, 11) (1, 12)
    """)
        self.check_tokenize('f"{1+1"', """\
diff --git a/Lib/tokenize.py b/Lib/tokenize.py
                    mid_expr += c
            case '}':
                # If two }} are seen, then the first one is skipped and the
                # second is added as part of the fstring_middle token
                if escaping:
                    escaping = False
                    mid_token += c
                    continue
                elif len(middle) > position + 1 and middle[position + 1] == '}':
                    escaping = True
                    start += 1
                    continue

                if curly_brackets:
                    curly_brackets.pop()
                if mid_expr and not curly_brackets:
                    yield TokenInfo(
                        type=OP,
                        string='{',
                        start=end,
                        end=(line_number, end[1] + 1),
                        line=line)
                    end = line_number, end[1] + 1

                    mid_expr += c

                    mid_expr = mid_expr[1:-1]

                    # Find any first level : or !
                    curly_level = 0
                    break_char_index = -1
                    for char_index, char in enumerate(mid_expr):
                        if char == '{':
                            curly_level += 1
                        elif char == '}':
                            curly_level -= 1
                        elif char in {'!', ':'} and not curly_level:
                            break_char_index = char_index
                            break

                    expression_chunk = mid_expr
                    if break_char_index != -1:
                        expression_chunk = mid_expr[:break_char_index+1]

                    if encoding is not None:
                        buffer = BytesIO(expression_chunk.encode()).readline
                # second is added as part of the fstring_middle token.
                # This is only applied when parsing fstring_middle tokens,
                # not when parsing an expression.
                if not mid_expr:
                    if escaping:
                        escaping = False
                        mid_token += c
                    elif len(middle) > position + 1 and middle[position + 1] == '}':
                        escaping = True
                    else:
                        buffer = StringIO(expression_chunk).readline
                    for t in _tokenize(buffer, encoding, fstring_mode=True):
                        mid_token += c
                else:
                    # parsing an expression
                    if curly_brackets:
                        curly_brackets.pop()
                    if not curly_brackets:
                        yield TokenInfo(
                            type=t.type,
                            string=t.string,
                            start=(t.start[0] - 1 + end[0], t.start[1] + end[1]),
                            end=(t.end[0] - 1 + end[0], t.end[1] + end[1]),
                            line=line
                        )

                    end = t.end[0] - 1 + end[0], t.end[1] + end[1]

                    if break_char_index != -1:
                        formatting_chunk = mid_expr[break_char_index+1:]
                        for t in _tokenize_fstring_middle(
                            middle=formatting_chunk,
                            start=end[1],
                            line_number=line_number,
                            line=line,
                            encoding=encoding):

                            yield t
                            end = t.end

                    yield TokenInfo(
                        type=OP,
                        string='}',
                        start=end,
                        end=(line_number, start + 1),
                        line=line)
                            type=OP,
                            string='{',
                            start=end,
                            end=(line_number, end[1] + 1),
                            line=line)
                        end = line_number, end[1] + 1

                    mid_expr = ''
                    end = line_number, start + 1
                else:
                    if mid_expr:
                        mid_expr += c

                        mid_expr = mid_expr[1:-1]

                        # Find any first level : or !
                        curly_level = 0
                        break_char_index = -1
                        for char_index, char in enumerate(mid_expr):
                            if char == '{':
                                curly_level += 1
                            elif char == '}':
                                curly_level -= 1
                            elif char in {':'} and not curly_level:
                                break_char_index = char_index
                                break

                        expression_chunk = mid_expr
                        if break_char_index != -1:
                            expression_chunk = mid_expr[:break_char_index+1]

                        if encoding is not None:
                            buffer = BytesIO(expression_chunk.encode()).readline
                        else:
                            buffer = StringIO(expression_chunk).readline
                        for t in _tokenize(buffer, encoding, fstring_mode=True):
                            yield TokenInfo(
                                type=t.type,
                                string=t.string,
                                start=(t.start[0] - 1 + end[0], t.start[1] + end[1]),
                                end=(t.end[0] - 1 + end[0], t.end[1] + end[1]),
                                line=line
                            )

                        end = t.end[0] - 1 + end[0], t.end[1] + end[1]

                        if break_char_index != -1:
                            formatting_chunk = mid_expr[break_char_index+1:]
                            for t in _tokenize_fstring_middle(
                                middle=formatting_chunk,
                                start=end[1],
                                line_number=line_number,
                                line=line,
                                encoding=encoding):

                                yield t
                                end = t.end

                        yield TokenInfo(
                            type=OP,
                            string='}',
                            start=end,
                            end=(line_number, start + 1),
                            line=line)

                        mid_expr = ''
                        end = line_number, start + 1
                    else:
 mid_token += c
 mid_expr += c
            case '\n':
                if mid_expr:
                    mid_expr += c
            type=FSTRING_MIDDLE,
            string=mid_token,
            start=end,
            end=(line_number,end[1] + len(mid_token)),
            end=(line_number,start),
            line=line)
    end = line_number,end[1] + len(mid_token)
    end = line_number,start

    if curly_brackets:
        lnum, pos = curly_brackets.pop()
Original file line number	Diff line number	Diff line change
Expand Up		@@ -400,9 +400,9 @@ def test_string(self):
		OP '{' (1, 6) (1, 7)
		NAME 'b' (1, 7) (1, 8)
		OP '!' (1, 8) (1, 9)
		FSTRING_MIDDLE 'r' (1, 9) (1, 10)
		OP '}' (1, 10) (1,12)
		FSTRING_MIDDLE '}c' (1,12) (1, 14)
		NAME 'r' (1, 9) (1, 10)
		OP '}' (1, 10) (1,11)
		FSTRING_MIDDLE '}c' (1,11) (1, 14)
		FSTRING_END '"' (1, 14) (1, 15)
		""")
		self.check_tokenize('f"{{{1+1}}}"', """\
Expand All		@@ -412,8 +412,8 @@ def test_string(self):
		NUMBER '1' (1, 5) (1, 6)
		OP '+' (1, 6) (1, 7)
		NUMBER '1' (1, 7) (1, 8)
		OP '}' (1, 8) (1,10)
		FSTRING_MIDDLE '}' (1,10) (1, 11)
		OP '}' (1, 8) (1,9)
		FSTRING_MIDDLE '}' (1,9) (1, 11)
		FSTRING_END '"' (1, 11) (1, 12)
		""")
		self.check_tokenize('f"{1+1"', """\
Expand Down
Original file line number	Diff line number	Diff line change
Expand Up		@@ -682,88 +682,88 @@ def _tokenize_fstring_middle(middle, start, line_number, line, encoding):
		mid_expr += c
		case '}':
		# If two }} are seen, then the first one is skipped and the
		# second is added as part of the fstring_middle token
		if escaping:
		escaping = False
		mid_token += c
		continue
		elif len(middle) > position + 1 and middle[position + 1] == '}':
		escaping = True
		start += 1
		continue

		if curly_brackets:
		curly_brackets.pop()
		if mid_expr and not curly_brackets:
		yield TokenInfo(
		type=OP,
		string='{',
		start=end,
		end=(line_number, end[1] + 1),
		line=line)
		end = line_number, end[1] + 1

		mid_expr += c

		mid_expr = mid_expr[1:-1]

		# Find any first level : or !
		curly_level = 0
		break_char_index = -1
		for char_index, char in enumerate(mid_expr):
		if char == '{':
		curly_level += 1
		elif char == '}':
		curly_level -= 1
		elif char in {'!', ':'} and not curly_level:
		break_char_index = char_index
		break

		expression_chunk = mid_expr
		if break_char_index != -1:
		expression_chunk = mid_expr[:break_char_index+1]

		if encoding is not None:
		buffer = BytesIO(expression_chunk.encode()).readline
		# second is added as part of the fstring_middle token.
		# This is only applied when parsing fstring_middle tokens,
		# not when parsing an expression.
		if not mid_expr:
		if escaping:
		escaping = False
		mid_token += c
		elif len(middle) > position + 1 and middle[position + 1] == '}':
		escaping = True
		else:
		buffer = StringIO(expression_chunk).readline
		for t in _tokenize(buffer, encoding, fstring_mode=True):
		mid_token += c
		else:
		# parsing an expression
		if curly_brackets:
		curly_brackets.pop()
		if not curly_brackets:
		yield TokenInfo(
		type=t.type,
		string=t.string,
		start=(t.start[0] - 1 + end[0], t.start[1] + end[1]),
		end=(t.end[0] - 1 + end[0], t.end[1] + end[1]),
		line=line
		)

		end = t.end[0] - 1 + end[0], t.end[1] + end[1]

		if break_char_index != -1:
		formatting_chunk = mid_expr[break_char_index+1:]
		for t in _tokenize_fstring_middle(
		middle=formatting_chunk,
		start=end[1],
		line_number=line_number,
		line=line,
		encoding=encoding):

		yield t
		end = t.end

		yield TokenInfo(
		type=OP,
		string='}',
		start=end,
		end=(line_number, start + 1),
		line=line)
		type=OP,
		string='{',
		start=end,
		end=(line_number, end[1] + 1),
		line=line)
		end = line_number, end[1] + 1

		mid_expr = ''
		end = line_number, start + 1
		else:
		if mid_expr:
		mid_expr += c

		mid_expr = mid_expr[1:-1]

		# Find any first level : or !
		curly_level = 0
		break_char_index = -1
		for char_index, char in enumerate(mid_expr):
		if char == '{':
		curly_level += 1
		elif char == '}':
		curly_level -= 1
		elif char in {':'} and not curly_level:
		break_char_index = char_index
		break

		expression_chunk = mid_expr
		if break_char_index != -1:
		expression_chunk = mid_expr[:break_char_index+1]

		if encoding is not None:
		buffer = BytesIO(expression_chunk.encode()).readline
		else:
		buffer = StringIO(expression_chunk).readline
		for t in _tokenize(buffer, encoding, fstring_mode=True):
		yield TokenInfo(
		type=t.type,
		string=t.string,
		start=(t.start[0] - 1 + end[0], t.start[1] + end[1]),
		end=(t.end[0] - 1 + end[0], t.end[1] + end[1]),
		line=line
		)

		end = t.end[0] - 1 + end[0], t.end[1] + end[1]

		if break_char_index != -1:
		formatting_chunk = mid_expr[break_char_index+1:]
		for t in _tokenize_fstring_middle(
		middle=formatting_chunk,
		start=end[1],
		line_number=line_number,
		line=line,
		encoding=encoding):

		yield t
		end = t.end

		yield TokenInfo(
		type=OP,
		string='}',
		start=end,
		end=(line_number, start + 1),
		line=line)

		mid_expr = ''
		end = line_number, start + 1
		else:
		mid_token += c
		mid_expr += c
		case '\n':
		if mid_expr:
		mid_expr += c
Expand All		@@ -785,9 +785,9 @@ def _tokenize_fstring_middle(middle, start, line_number, line, encoding):
		type=FSTRING_MIDDLE,
		string=mid_token,
		start=end,
		end=(line_number,end[1] + len(mid_token)),
		end=(line_number,start),
		line=line)
		end = line_number,end[1] + len(mid_token)
		end = line_number,start

		if curly_brackets:
		lnum, pos = curly_brackets.pop()
Expand Down