难度:⭐
题目描述:
给定一个字符串,找到它的第一个不重复的字符,并返回它的索引。如果不存在,则返回 -1。
示例1:
1 | s = "leetcode" |
提示:你可以假定该字符串只包含小写字母。
解题过程:
思路:
计数法统计字符串s中不同字符的次数,然后遍历s,返回出现次数是1的字符的索引,不存在则返回-1。
c++代码:(执行用时24ms,击败95.50%,内存消耗10.7M,击败62.96%)
1 | class Solution { |
官方题解:
方法一:使用哈希表存储频数
思路与算法
我们可以对字符串进行两次遍历。
在第一次遍历时,我们使用哈希映射统计出字符串中每个字符出现的次数。在第二次遍历时,我们只要遍历到了一个只出现一次的字符,那么就返回它的索引,否则在遍历结束后返回 −1。
c++代码:(执行用时100ms,击败53.87%,内存消耗10.9M,击败22.16%)
1 | class Solution { |
复杂度分析
时间复杂度:$O(n)$,其中 $n$ 是字符串 $s$ 的长度。我们需要进行两次遍历。
空间复杂度:$O(|\Sigma|)$,其中 $\Sigma$ 是字符集,在本题中 $s$ 只包含小写字母,因此 $|\Sigma| \leq 26$。我们需要 $O(|\Sigma|)$ 的空间存储哈希映射。
方法二:使用哈希表存储索引
思路与算法
我们可以对方法一进行修改,使得第二次遍历的对象从字符串变为哈希映射。
具体地,对于哈希映射中的每一个键值对,键表示一个字符,值表示它的首次出现的索引(如果该字符只出现一次)或者 -1(如果该字符出现多次)。当我们第一次遍历字符串时,设当前遍历到的字符为 c,如果 c 不在哈希映射中,我们就将 c 与它的索引作为一个键值对加入哈希映射中,否则我们将 c 在哈希映射中对应的值修改为 -1。
在第一次遍历结束后,我们只需要再遍历一次哈希映射中的所有值,找出其中不为 -1 的最小值,即为第一个不重复字符的索引。如果哈希映射中的所有值均为 -1,我们就返回 -1。
c++代码:(执行用时176ms,击败20.24%,内存消耗10.9M,击败19.62%)
1 | class Solution { |
复杂度分析
时间复杂度:$O(n)$,其中 $n$ 是字符串 $s$ 的长度。第一次遍历字符串的时间复杂度为 $O(n)$,第二次遍历哈希映射的时间复杂度为 $O(|\Sigma|)$,由于 $s$ 包含的字符种类数一定小于 $s$ 的长度,因此 $O(|\Sigma|)$ 在渐进意义下小于 $O(n)$,可以忽略。
空间复杂度:$O(|\Sigma|)$,其中 $\Sigma$ 是字符集,在本题中 $s$ 只包含小写字母,因此 $|\Sigma| \leq 26$。我们需要 $O(|\Sigma|)$ 的空间存储哈希映射。
方法三:队列
思路与算法
我们也可以借助队列找到第一个不重复的字符。队列具有「先进先出」的性质,因此很适合用来找出第一个满足某个条件的元素。
具体地,我们使用与方法二相同的哈希映射,并且使用一个额外的队列,按照顺序存储每一个字符以及它们第一次出现的位置。当我们对字符串进行遍历时,设当前遍历到的字符为 c,如果 c 不在哈希映射中,我们就将 c 与它的索引作为一个二元组放入队尾,否则我们就需要检查队列中的元素是否都满足「只出现一次」的要求,即我们不断地根据哈希映射中存储的值(是否为 -1)选择弹出队首的元素,直到队首元素「真的」只出现了一次或者队列为空。
在遍历完成后,如果队列为空,说明没有不重复的字符,返回 -1,否则队首的元素即为第一个不重复的字符以及其索引的二元组。
小贴士
在维护队列时,我们使用了「延迟删除」这一技巧。也就是说,即使队列中有一些字符出现了超过一次,但它只要不位于队首,那么就不会对答案造成影响,我们也就可以不用去删除它。只有当它前面的所有字符被移出队列,它成为队首时,我们才需要将它移除。
c++代码:(执行用时216ms,击败12.18%,内存消耗11.2M,击败5.29%)
1 | class Solution { |
复杂度分析
时间复杂度:$O(n)$,其中 $n$ 是字符串 $s$ 的长度。遍历字符串的时间复杂度为 $O(n)$,而在遍历的过程中我们还维护了一个队列,由于每一个字符最多只会被放入和弹出队列最多各一次,因此维护队列的总时间复杂度为 $O(|\Sigma|)$,由于 $s$ 包含的字符种类数一定小于 $s$ 的长度,因此 $O(|\Sigma|)$ 在渐进意义下小于 $O(n)$,可以忽略。
空间复杂度:$O(|\Sigma|)$,其中 $\Sigma$是字符集,在本题中 $s$ 只包含小写字母,因此 $|\Sigma| \leq 26$。我们需要 $O(|\Sigma|)$的空间存储哈希映射以及队列。
总结:
官方题解第一种方法和我的思路一样,另外两种方法其实稍微复杂了一点但效率并没有提高反而下降了,还是第一种简单易懂另两种方法个人认为不好,只能说算是一种方法。