【卧槽!快来看我考古发现了什么!!![网页链接]还记得上回国家青年科技奖的报道吗?原来那根本不是诗诗第一次上央媒!】
***
下午两点五十六分。
一段三年前的采访视频忽然以势如破竹的姿态直冲热搜。
点进实时广场甚至都看不见粉籍, 诗笺的帖子全被挤下去了,一片片的都是路人在线尖叫“呜呜呜这是什么神仙妹妹!我也成年了,我可以等到一个国家级项目组吗”, 场面极为壮观,热度持续暴涨, 无数网友激情转发并在自己首页疯狂安利“啊啊啊啊宝子们快去看!看完你会回来和我一起尖叫的!”。
于是世界各地又有无数网友被吸引, 带着满满的好奇心点击播放键。
视频里是央视科技频道的午间新闻画面, 一身白衣的少女握着话筒落落大方站在镜头前, 身后是开阔气派的实验室, 眼中是属于青春的朝气与星芒。耀眼得出众,也,年轻得出奇。
那是18岁的杜诗怡。
女孩已经风华初成,面对如此阵仗丝毫不见紧张,含着笑意立在红外热像仪和视觉检测机旁边,而画外音也在同时响起:
“在我国计算机领域著名专家秦院士领衔的国科B2194号课题组中,有一支特殊的小队,这里的成员均为95后大学生,联袂于北城信科基地掀起一场青春风暴。小队领头人杜诗怡同学,来自Y大计算机学院,她在今年五月刚刚年满十八周岁,但这已经是她第三次参与国家级项目研发,本次由她带队负责的Harris角点特征提取、Softmax分类器、OCR光学字符识别等七项功能已经全部开发完成,正在进行联调测试,预计将在下周交付上线。诗怡你好……”
众网友:!
【什么啊啊啊啊妹妹刚成年就在国家级项目团队里带组了吗!!!卧槽啊吓得我原地一个大劈叉!】
【而且之前居然就已经有过两次参与经验了我天!好家伙啊好家伙,大一都没上完就打入国科院内部了吗?!】
【靠……我摸到粉丝超话看见置顶的实绩图了……这是人类能拥有的履历吗?!好厉害的新生代,才21岁的宝藏级天才——嘶——忽然感觉咱们国家未来几十年的科技大发展都超有希望!妹妹牛逼!Y大牛逼!】
【没错我们华国的科研人员最牛逼!但是噗哈哈哈哈哈对不起忽然笑喷,请问是第一周在其他家争奇斗艳的文字控评里潇洒出圈的那张实绩图吗?我微信上还能翻到当时小姐妹的嚎叫,刷了满屏的“淦!”痛诉诗笺不讲武德,居然不跟她们拼传统粉圈那套,纯靠正主简历躺赢哈哈哈哈哈哈】
【嘿嘿嘿本诗笺现身说法——现在的置顶才不是当初那张!明明是它的N.0版本!我们每周都有新补内容上去的!骄傲挺胸!】
【啧啧啧笑死,还N.0!知道你们偶像每周都有新事迹了!好爽啊诗笺,不用控评不用反黑不用盯数据,掰掰手指头好像要做的事就只有跟在正主后面快乐更新实绩图——妥妥的内娱天堂啊,兄弟们把“粉杜诗怡好省心”打在公屏上!】
这话一出简直一呼百应,瞬间就刷爆了直播间。杜诗怡的名字再次成了流量密码,被无数雀跃群众加诸以最热烈的赞誉词,所以哪怕后续有人小心翼翼又放了个链接出来,也没太影响到网上的气氛。
新出来的这位貌似是个温温柔柔的妹子,发帖的语气都软软的:
“先说明哦我知道诗诗超超超厉害~是永远有奇迹给我们看的镇圈女王!但是,但是这个课题的话,大家也先不要抱那么大的期望啦~”
“就,刚刚学着诗诗去搜了搜相关的新闻,[网页链接],然后就看到了这个,嗯……”
“我不知道有多少姐妹和之前的我一样抱有天真想法,觉得拼合碎片就类似于上轮连接家具,对他们来说是一件每天都会有新进展的事情,区别只在于数量多少的问题。可是,不是这样的,其实,哪怕整整一周只能解锁一例缀合,都已经很厉害了呀。”
众网友带着些茫然点进去,还没看清内容,就先被朝华记者的名头镇了一脸。
背靠国内最大的出版社,朝华在群众心中可谓是文稿界的金字招牌,平常扫新闻的时候看到出处是它的署名,就会下意识产生“说得对”的第一印象。
而再定睛看去,朝华出手果然不凡,文章寥寥数笔,却重若千钧。它以纪录片的口吻,讲述了残片缀合的背景与现实。
这个在计算机界还没有真正形成门派的方向,却是古文字研究中相当重要的基石。史学界历来都有这样一个共识:一旦将两片残骨拼合成功,其价值不亚于出土一块新的甲骨。合二为一背后蕴含的意义,足以让最德高望重的老教授为之点头。
只是,这条路千难万难。
我国历史悠久、遗存丰富,目前出土的甲骨、竹简、帛书残片已达数百万块之多,与之相对的,是哪怕加上在校硕博生也不到千人的专业缀合者数量,人员配备严重不足。数十年来,这些学者默默耕耘在荧荧青灯下,埋首于浩浩残片间,去为每一个迷路的游子找寻契合的家园。通过这样艰苦卓绝的努力,也确实呈现出了很多令人钦敬的成果,每年都会有数例残片宣告成功缀合,一点一点接续着这个研究方向的星火希望。
但手工拼缀,毕竟太艰辛。
“据统计,我国已发现的古文字残卷中,只有百分之六已实现缀合。”历史学领域著名泰斗黄岚院士这样感叹,“海量的珍贵史料仍飘零散落,亟待拼接。”
仍有74%的甲骨尚未归位。
仍有83%的竹简尚未归位。
仍有92%的帛书尚未归位。
它们在无声等待着一场跨越千年的团圆。
而仅靠人力,路漫漫其修远兮。
……
网上沉默了一瞬。
【哇……我还以为碎片缀合就跟拼图游戏似的,没想到这么难啊】
【是啊……这后面居然说西原遗址六年前出土的帛书到现在还没有全部拼完诶……那还只是七万块碎片啊,金汀遗址十三万!猫猫惊恐.jpg】
【所以现在引入计算机辅助呀,不然这得拼到猴年马月去?啊啊啊啊到时候是不是就像魔法一样,鼠标轻轻一点,所有碎片就哗啦一下拼成一幅完整的图呀!好期待好期待!!!】
【虽然程序做好之后的实际效果是那样的神仙场面没错,但是姐妹你慢点期待……这代码写起来可太复杂了,教计算机拼图比教人拼图难顶多了……不知道要花多长时间,反正应该,挺久的】
【!需要很久吗?天,我还想着诗诗能一天出成果三天大丰收五天全搞定呢……】
【叹气,就是知道很多人会这么想,刚刚那个妹子才会出来提醒啊……】
没办法,归根结底还是杜诗怡太秀,第一轮首日迅速做出了多个角度的数据分析,第二轮首日飞快达到了惊人的3000处理量,第三轮首日几乎把语音控制做完……这些说出来都觉得离谱的事迹,已经让几乎所有观众形成了思维惯性,觉得首日出成果是一件无比自然也无比正常的事情,非常的顺理成章。
——俗称:被宠坏啦。
可是这一轮……
诚然杜诗怡依旧势头强劲,火速就完成了[全像素识别]的编写执行,也让许多人以为这个课题和之前没有什么不同。
但千里之外的北城,A大Y大H大的教授们都无比郑重地望着屏幕,专注严肃,敛目凝神。
——真正的挑战,才刚刚开始。
***
如果简单一点来说,不管选用颜色提取还是边缘轮廓提取,都可以把数字缀合分为三步。
第一步把碎片图像转化为数字形式,对应着术语中的[全像素识别]。
第二步对海量数据进行挖掘分析,训练计算机找到其中暗含的规律。
第三步将几十亿条数据再转回图片,也就是最后一刹那的神仙复原。
它们的共性是——都踏马很难。难到单独拎一个出来就完全可以作为硕博生的毕业设计。
它们的差异是——后两条更难。
其他人如今在啃的论文都属于第一步的范畴,在这个时候,还可以通过自身的知识储备规避掉智网消失术,可是从第二步开始就再也没有这样的捷径了。没有任何人写过帛书图像的数据分析策略,更没有任何人写过如何一键将海量碎片拼接成图,一切都要靠实习生自己了。
这是一场真正的开荒。
没有人能知道前路有多漫长。
明白这一点之后的弹幕再次陷入了长时间的沉默。
所以说……手工拼合,考古人难,数字拼合,程序员难……反正总归科研就没有轻松的啊。
不过大家在感慨之后,还是互相打气。
【害,没事,咱提前把预防针打好。估计他们光是前期立框架就要折腾两天,到周三才会有拼图成果出现?大家做好心理准备别催宝贝们就行】
【嗯嗯!好事多磨,等一等也没关系!要真能用计算机实现缀合,哪怕只有两块,都绝对是里程碑的意义啊!!!】
导播室内,蹲在电脑前啃鸡腿的导演瞅了一眼网上的风向,咂咂嘴摇了摇头:“周三出成果?”