[DFA|有限状态机] leetcode 8 字符串转换整数(atoi)
1.题目
题目链接
请你来实现一个 atoi 函数,使其能将字符串转换成整数。
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:
- 如果第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字字符组合起来,形成一个有符号整数。
- 假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成一个整数。
- 该字符串在有效的整数部分之后也可能会存在多余的字符,那么这些字符可以被忽略,它们对函数不应该造成影响。
注意:假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换,即无法进行有效转换。
在任何情况下,若函数不能进行有效的转换时,请返回 0 。
提示: - 本题中的空白字符只包括空格字符 ’ ’ 。
- 假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 [−231, 231 − 1]。如果数值超过这个范围,请返回 INT_MAX (231 − 1) 或 INT_MIN (−231) 。
示例 1:
输入: "42"
输出: 42
示例 2:
输入: " -42"
输出: -42
解释: 第一个非空白字符为 '-', 它是一个负号。
我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到 -42 。
示例 3:
输入: "4193 with words"
输出: 4193
解释: 转换截止于数字 '3' ,因为它的下一个字符不为数字。
示例 4:
输入: "words and 987"
输出: 0
解释: 第一个非空字符是 'w', 但它不是数字或正、负号。
因此无法执行有效的转换。
示例 5:
输入: "-91283472332"
输出: -2147483648
解释: 数字 "-91283472332" 超过 32 位有符号整数范围。
因此返回 INT_MIN (−2^31) 。
2.分析
2.1.有限状态机
有限状态机能干啥:建模状态的变化。
例如交通信号灯就是一种简单的有限状态机,其有三种状态:红、黄、绿。
2.2.状态start
由于输入字符串前可能有空格,因此我们将
- 还没有读取到+、-
- 还没有读取到数字0~9
- 还没有读取到其他字符
的状态定义为start。
2.3.状态signed
模拟我们读到数字前正负号时的状态。
2.4.状态in_number
模拟我们正在读取数字内容时的状态。
2.5.状态end
模拟读取完数字退出的状态
2.6.状态转移
为了方便起见,我们只讨论各个状态可能转移至哪些状态。
空格 | 正负号 | 数字 | 其他 | |
---|---|---|---|---|
start | start | signed | in_number | end |
signed | end | end | in_number | end |
in_number | end | end | in_number | end |
end | end | end | end | end |
start
- 遇到空格:停留在start状态
- 遇到正负号:转移至signed状态
- 遇到数字:转移至in_number状态
- 其他:转移至end状态
signed
正负号后面只有接数字才能形成一个合法的数字,因此:
- 遇到数字:转移至in_number状态
- 其他:转移至end状态
in_number
数字后面只有接数字才能形成一个合法的数字,因此:
- 遇到数字:停留在in_number状态
- 其他:转移至end状态
end
end状态下无论输入如何均停留在end状态。
3.代码
class Automaton {
//初始状态为start
string state = "start";
//状态转移矩阵
unordered_map<string, vector<string>> table = {
{"start", {"start", "signed", "in_number", "end"}},
{"signed", {"end", "end", "in_number", "end"}},
{"in_number", {"end", "end", "in_number", "end"}},
{"end", {"end", "end", "end", "end"}}
};
//状态转移矩阵的列索引
int get_col(char c) {
if (isspace(c)) {
return 0;
}
if (c == '+' or c == '-') {
return 1;
}
if (isdigit(c)) {
return 2;
}
return 3;
}
public:
int sign = 1;//符号位,默认为1表正数,否则-1表负数
long long ans = 0;//结果
void get(char c) {
state = table[state][get_col(c)];//获取新状态
//如果处在读取数字状态
if (state == "in_number") {
//更新ans
ans = ans * 10 + c - '0';
//判断溢出
ans = sign == 1 ? min(ans, (long long)INT_MAX) : min(ans, -(long long)INT_MIN);
} else if (state == "signed") {
//如果处在读取正负号状态,更新符号位
sign = c == '+' ? 1 : -1;
}
}
};
class Solution {
public:
int myAtoi(string str) {
Automaton automaton;
//顺序读取字符串中各个字符
for (char c : str) {
automaton.get(c);
}
return automaton.sign * automaton.ans;
}
};
版权声明:本文为qq_40714949原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。