我爱读小说网

字:
关灯 护眼
我爱读小说网 > 股狼孤影 > 第222章 数据抓取 (3 / 9)

第222章 数据抓取 (3 / 9)

        ? 融资余额降幅:用周严的铜算盘复核“小数位异常”(如“降幅5.03%”可能为人工凑数,真实值应为5%);

        ? 融券余额突增:抓取“单日增幅>20%”的标的(传统系统常忽略的“做空信号”)。

        ? 贪婪指数数据源:

        ? 机构“暗盘增持”:通过“Level-2数据”识别“机构专用席位”净买入(伪装成“散户”的小单合并);

        ? 大宗交易溢价:采集“溢价率>5%”的交易(传统系统只看“折价抛售”)。

        “每个数据都要‘带人性温度’,”陈默在活页本上写,“比如‘绝望帖’的配图——如果配的是‘K线图+泡面桶’,比纯文字更真实。”

        (2)复合情绪:政策的“黑天鹅雷达”

        陈默额外承担“政策情绪”抓取:用Python爬虫(林静协助)扫描“国务院官网”“央行货币政策执行报告”,提取“监管关键词”(如“专项整治”“窗口指导”),按“严厉程度”赋分(1-5分)。

        “2021年‘教培行业整顿’前,政策文件里‘规范’一词出现频率骤增300%,”他指着“情绪沙盘”上的政策曲线,“这个信号比‘股吧恐慌帖’早出现两周。”

        2. 林静的“逻辑数据”:用“代码手术刀”剖开“非结构化”

        (1)反欺诈“三棱镜”数据

  The content is not finished, continue reading on the next page