面试分享！猿辅导计算机视觉算法工程师一面

2023-05-30 11:50 作者:深度之眼官方账号 0人读过 | 我要投稿

来源：投稿作者：LSC
编辑：学姐

总共时长45分钟，首先是自我介绍，然后开始面试。

1.旋转数组[1,2,3,4,5,6,7]--->[5,6,7,1,2,3,4]，找出k是否存在一个旋转数组中，旋转数组一开始是有序的。

二分:

Eg：a=”abcdfgd” b=”abcdffd” yes

a=”bbiiom” b=”abiion” no

a=”ccaabb” b=”aabbcc” no

法1: 动态规划编辑距离

法2: 直接判断:

(1)先判断两个字符串的长度相差是否大于1，是no，否继续
(2)统计每个字符串中每个字母的个数，再计算相同字母每个字符串的差，用字典来统计，一旦有差大于1，是no，否继续
(3)如果两个字符串等长，遍历两个字符串，是否存在超过1相同位置的值不同的，是no，否yes，不一样长的话，遍历，如果相同位置不同，长的指针向后移动，再次字符不相同就是no，否则yes。

主要介绍项目的数据、任务、模型、参数、优化和结果。

因为我项目的数据收到光照这个因素的影响比较大，所以特地进行数据增强，增加模型的泛化性。

对CRNN比较熟悉，入门ocr必学的经典算法。

CRNN=CNN+RNN+CTC，不用先对单个文字进行切割，而是将文本识别转化为时序依赖的序列学习问题，就是基于图像的序列识别，使用 CTC 损失，把从循环层获取的一系列标签分布转换成最终的标签序列。

此外还有SVTR，是PaddleOCR的PP-OCRv3的主要模型, 模型小, 效果好，主要就是利用Transformer替代了RNN, 得益于self-attention机制, 这样面对不规则文本图像的时候应该有更好的信息抽取能力, 可以更好的抽取有序后验概率矩阵。

PaddleOCR和mmocr框架，这两个都是当下最流行的ocr框架，两种框架的文本检测和识别的代码结构相似，PaddleOCR更全面，我使用频率较高，支持多种语言文本，mmocr对中文支持行较差，总的来说准确率大体都差不多。

久违的分享一下面试经验，希望可以给还在找工作的同学一点帮助~

另外关注“学姐带你玩AI”公众号

回复“简历”可以免费领取300+简历模板＆算法工程师万能简历公式！

标签：