NLP
Lecture1: Text NormalizationWord TokenizationSpace-based tokenization即利用空格(和标点符号)分词 e.g.I love you,分成 I, love, you 三个token 但这样遇到符号多的,有hyfen的,数字字母混杂的文本就不好处理了,所以要用正则表达式: 正则表达式正则元字符: \w :匹配字母、数字、下划线 \d :匹配数字 \s :匹配空白符(空格、制表符、换行符等) [A-Z] :匹配大写英文字符(注意:正确写法是 A-Z 而非 A,Z) [0-9] :匹配数字(等价于 \d) 数量控制符: + :匹配前面的字符 1 次或多次(等价于 {1,}) * :匹配前面的字符 0 次或多次(等价于 {0,}) ? :匹配前面的字符 0 次或 1 次(等价于 {0,1}) {n} :匹配前面的字符正好 n 次 {n,m} :匹配前面的字符 n 到 m 次(包含 n 和 m) \. 代表 .这...
成都游记
天府之国成都,据说是西南地区的上海,不过我们去的时候空气不好,能见度很低,整个城市都感觉雾蒙蒙的。 接下来我将用景点名称+一句评论+图的形式列举完这次旅行所有的景点。 Day1: ifs广场,大熊猫爬楼打卡地,晚上拍也不错 春熙路,老成都的商业街,比较普通没什么值得拍的。 太古里,比春熙路奢华,但依旧没什么可拍的,我就拍了个牌匾证明一下自己来过。 安顺廊桥,很多人把他当做九眼桥了,实际上真的九眼桥没这座桥好看 Day2: 天府广场,就是一个广场,可以拍正面的毛主席像,不过我觉得拍广场还是要到四川科技馆四楼拍才好看。 人民公园,门口有川军抗日将士纪念碑。其实就是一个普通的公园,最有意思的是里面的相亲角,我在里面看了好久。 杜甫草堂,杜甫的故居,里面环境不错,有红墙竹海,介绍了杜甫生平以及各朝诗人。 武侯祠,纪念诸葛亮以及刘关张三人的祠堂,地方不大,也有适合拍照打卡的红墙,如果没有蜀汉情怀的可以不用来 锦里,全国统一的商业街,就在武侯祠后面,参观完武侯祠出来就是了。我也是就拍了张牌匾证明自己来过了。 双子塔,晚上有灯光秀,站在天桥上面拍出来还是挺好看的。 Da...
芝加哥游记
在纽约游记的末尾,我提到了匆匆忙忙逛完大都会博物馆就去赶飞机了,而赶的正是前往芝加哥的飞机。我看app上提示机上有提供晚餐,可是美联航最终就给了一杯可乐和一块华夫饼,最后我还是去了民宿旁边的麦当劳解决了晚餐。 纽约和波士顿的地铁公交,我都是直接刷visa卡的,然而在芝加哥,似乎visa卡刷不了,只能用当地的一日通ventra card。不过在我买一日通之前坐的公交地铁我并没有付一分钱,地铁管理员看我刷了半天没刷出来就直接开闸门让我过了。公交车更是离谱,我直接不刷上车也没人管。这一波操作直接怒省将近10刀。 提到芝加哥,人们总是会先想到他的危险,事实上,芝加哥的南部也就是芝加哥大学那边是比较危险的,而我们所订的民宿位于一片宁静平和的北部。这次订的民宿非常有意思,是和房东老爷爷住在一起,他和妻子住一楼,而我们住二楼。房间里有很多他们家庭的合照,女儿儿子小时候的照片,那种感觉就像是住在别人家里一样。我推测本来他们一大家子都住在这里,然后随着儿女们长大成家渐渐搬出去住了,二楼就空了出来,于是就被改造成民宿了。房东说他已经接待了各个学校的学生,UCB,UCLA,南加大,纽大,很多学生来芝加...
纽约游记
我们从波士顿出发,由于Amtrak晚点,到纽约时已经是晚上七点了,我们和同行的一个skd同学的在NYU的高中同学碰了个头吃了顿饭,然后去时代广场兜了一圈,但时代广场全是人,我们匆匆拍下几张照片就回了Hoboken的民宿。 (附时代广场图片一张) 后面三天,前往曼哈顿岛玩了一坤天。 第一站,自由女神像。来这里我才知道原来自由女神像是在岛上的,过去看还要专门乘船。 (附在岛上雕像脚底下拍的自由女神像图片一张) (附隔海眺望纽约天际线图片一张) 第二站,华尔街。我们是在新泽西的liberty state park上的船,在登岛逛完自由女神像之后直接在battery park下船,这样就直接到曼哈顿岛上了。再走一小段就到华尔街了,当时正值圣诞,人声鼎沸,我们同样也是匆匆拍了几张就走了。 (附华尔街铜牛图片一张) (附华尔街图片一张) (附纽交所图片一张) 第三站,911纪念地。当年被撞的双子塔如今只剩两个大坑,旁边则是新的世贸大厦一号楼和世界贸易中心的楼。 (附双子塔遗址图片一张) (附新的世贸大厦一号楼图片一张) (附世界贸易中心图片一张) 第四站,Washington square ...
波士顿游记
这趟行程是在期末周结束之后和几个skd同学一起去的。从美西到美东不是一段很短的距离,大约相当于从上海到新疆。为了省一天的住宿,我们订了晚上的飞机,从旧金山国际机场出发,途径费城转机前往波士顿,第一天的晚上就在飞机上过夜了。 事实证明这是一个很愚蠢的决定,经济舱根本睡不好觉,第一晚我们几乎没怎么睡,第二天到了民宿之后根本没精力再出去逛了,四个人直接倒头就睡,一直到下午三点多才起来。 值得一提的是,我们订的民宿是一个钉子户,在两侧林立的高楼直接显得尤为格格不入。 (附图一张) 起床之后,我们立刻前往freedom trail小逛一手。因为太阳要落山了,我们逛的尤其快,每个地方都快速打一遍卡就撤,其实应该找一个讲解员或者提前查一下资料再来看的。波士顿和英国很像,17世纪就有英国清教徒为追求宗教自由来到这里,建设发展这座城市。街上爱尔兰国旗和餐馆也很多,这是因为19世纪爱尔兰大饥荒,很多爱尔兰人横跨大西洋逃难逃到这里。 (附莫名像武康大楼的不知名楼图片一张) (附freedom trail图片n张,里面应该有一张是波士顿倾茶事件的发生地,但是逛的太快了没细看) (附昆西市场图片一张) 晚...
萨克拉门托游记
加州首府萨克拉门托,一座名不见经传的城市,在没查之前我还真不知道加州的首府是这里。在期末考试结束后的第二天我就直接乘Amtrak前往此地。 这是一座安静的小城,街上人不多,节奏很慢,并没有首府应有的繁华,但我在这里citywalk一天的体验却是非常不错,可能是我比较喜欢人少安静的地方。 (附街景图一张) (附某不知名教堂图片一张) 我的第一站是California state capitol,号称加州小白宫, 我去的时候旁边有很多工人,正在修建些什么。当时正值圣诞将至之际,大厦前还摆了一颗巨大圣诞树。 (附州议会大厦图片一张) (附圣诞树图片一张) 第二站是NBA球队国王队的主场。我还在场馆外面看了一眼今天国王队有没有比赛,有倒是有,不过不是主场比赛,不然我真打算去看一场。 (附主场场馆图一张) 第三站,tower bridge,这座桥号称萨克拉门托的金门大桥,比起真的金门大桥,在气势上还是逊色不少。 (附图一张) 第四站,California state railroad museum,我很少逛一个城市的博物馆,不过这所博物馆让我觉得确实值得一逛,里面有很多1:1大小的仿真火车...
圣何塞游记
在10月初国庆节期间,看着国内亲朋好友各种游玩晒图,我心痒难耐,于是一拍脑袋,和两个室友来san Jose 玩了一天。不过美国显然是没有国庆节的,因此我们也只能挑了一个周末出来 斯坦福我们的第一站是斯坦福大学。乘坐BART从downtown berkeley站坐到终点站Millbrae然后换乘caltrain。大概要花两个多小时,不过好消息是伯克利发的clipper card能让我们免费乘坐一切湾区的公共交通。 (附Caltrain双层火车图片一张) 斯坦福是一所优美而典雅的大学,不同于伯克利,他的建筑设计具有一种美感,仿佛令人置身于宫殿之中。毫不夸张的说,斯坦福是我目前见过最漂亮的大学。 (附Stanford校园图片n张) 我们当时去的时候,斯坦福人很少,当然本身作为私立大学,学生数量也不多,外加周末,人就更少了,那种幽静而又典雅的氛围令人陶醉。而在伯克利,一下课就摩肩擦踵,人声鼎沸,我很难体会到这种寂静优美的感觉。我们在斯坦福里逛了很久,可以说是把逛苹果总部的时间都匀给了斯坦福。 硅谷我们从斯坦福打车前往硅谷的谷歌总部,到达时已是下午两点半,由于时间有限,所以我们只去了这一个...
旧金山游记
初见在刚来伯克利的前几周,我参加了一个学校组织的San Fransisco scavenger hunt 活动,我和一个skd同学一起,又在活动中结识了三个国内其他学校同是来伯克利交换的女生,5个人一起在SF逛了一天。 活动开始时间是下午两点,因此我中午就到了旧金山,并在唐人街吃了一顿13刀的盐酥鸡饭,味道很一般,量也不大,甚至吃完之后胃还难受了一段时间,这让当时的我非常后悔那顿饭为什么没有选择吃麦当劳。 吃完后我在唐人街逛了一圈,唐人街还是挺复古的,有一种上世纪香港电影的感觉。街区里有一个广场,有一些下棋的大爷和唠嗑的大妈,和国内很相似,不过语言都是粤语。 其实这个scavenger hunt活动给了一张清单,本意是让我们根据清单去完成一些任务,例如找到一个会说三国语言的人,找到养猫的人等等。不过我们五人来参加这个活动的目的倒是出奇的一致,那就是找几个同学一起在SF玩一圈,因此我们并没有管这个清单,而是去了我们此行的第一站: 渔人码头。 渔人码头是一个标准的码头,唯一的特色可能是趴在平台上的海狮,或者码头边的摩天轮? 不过在码头边吹吹海风,看看街头表演,还是很惬意的。 (附渔人...
2025年终总结
现在是2026年1月1日上午11点,太平洋时间的26年第一天。窗外是刚下过小雨的旧金山国际机场,而我坐在机舱内,将我所能回忆起的2025,随指尖与屏幕的敲击记录在此。 一直以来,我都是没有记年记的习惯的。可两个月前一次凌晨失眠中记下的24年年记让我体会到了写年记的乐趣与意义。我承认一开始写这种年度总结纯粹是为了打发时间,包括写这篇的初衷也是因为飞机上的时间太过难熬。不过,每当我写完回头再看的时候,我总是能和文中的一切再度共鸣,或拍手称快,或顿足长叹。我想,这也许就是年记的意义所在吧。 言归正传,我希望自己能够在每一年年记的开头都用一个词来形容整一年,在24年的年度总结里,我说24年是重塑我人格的一年。那25年,我觉得这个词应当是挫折。去年既然说到我发现了我的一生挚爱——旅游,那么作为25年的第一个月份的一月,又是过年+寒假双重buff,我是自然不会放过这个天赐良机。于是在1月末2月初的7天时间里,我先是随父母自驾前往湖州弁山,丽水古堰画乡,龙泉黄茅尖,随后又马不停蹄地和两个同学前往雁荡山,以集齐三山五岳中的三山。我的计划是,第一天先到山脚下住一晚,第二天早上一起爬山,下午赶往温州...
Meta-learning
元学习(Meta-learning)元学习,顾名思义,就是学习如何学习。传统的机器学习方法通常需要大量的数据和时间来训练模型,而元学习旨在通过少量的数据和快速的适应能力,使模型能够更高效地学习新任务。 MAML(Model-Agnostic Meta-Learning)详解一句话版(先记住这个) MAML = 学一个“参数初始化”,使模型在遇到新任务时,只需极少步梯度下降就能学好。 关键词: 学的不是最终模型 学的是 初始化 目标是 快速适应新任务 一、为什么需要 MAML?(直觉)我们经常面对一族相关任务,例如: 不同但相似的分类任务 多个强化学习环境 不同类型的数学题、推理任务 传统方法的问题: 每个任务重新训练,成本高 训练一个统一模型,泛化能力有限 我们真正想要的是: 来一个新任务,只需要少量数据和少量梯度更新就能学好 这就是 Meta-Learning(学会学习) 的核心动机。