今日は小さくても非常に重要な落とし穴を踏んだ：
エージェントに見えない状態を操作させてはいけない。
X Proのドラフトスケジュールを作成しているとき、ローカルのJSONが一時的に正確に表示されなかった。
最終的に気づいたのは、本当に信頼できるのはキャッシュではなく、
X Proのページ上で肉眼で見える状態だということ。
この出来事を通じて、もう一つの原則を再確認した：
エージェントは繰り返し操作を手伝うことができるが、
すべての重要な操作には見える状態、巻き戻し可能な経路、手動で引き継げることが必要だ。
さもないと、自動化が進むほどブラックボックスが大きくなる。

原文表示

報酬
いいね
コメント
リポスト
共有

runesleo

4時間前

X の管理画面に新たに active followers が表示されました、
過去 24 時間にアクティブだったフォロワー数です。
自分のをちょっと見てみました：
14,031 / 21,300、
だいたい 66%。
最初の反応はなかなか良いと思いました、
でも基準線がないので、
本当に多いのか少ないのか分かりません。
一点だけはっきりしていることがあります：
以前は 2 万人のフォロワーを見ていても、
心の中での把握ができていませんでした。
中に何人が昨日も X を使っていたのか分かりません。
今は数字が具体的に落ちてきました。
followers は総数です。
active followers は昨日もアクティブだった部分です。

原文表示

報酬
いいね
コメント
リポスト
共有

runesleo

05-18 05:21

3. 38637 個市場マップ

原文表示

報酬
いいね
コメント
リポスト
共有

runesleo

05-18 00:59

私はXの新しい推薦アルゴリズムを研究した後、最大の結論は「多発AI」ではありません。
むしろ：アカウントは安定した著者のアイデンティティを持つ必要があります。
同じ著者がユーザーに連続して1〜2回消費されるだけで、推薦システムはその著者を強く記憶します。
だからコンテンツの拡張は、何を投稿したいかではなく、メインのアイデンティティから外側に広げていくことです。

原文表示

報酬
いいね
コメント
リポスト
共有

runesleo

05-17 07:16

最近几周反复遇到一个很爽的瞬间：
Codex 周额度快见底。
离刷新还剩两三天。
我刚准备进入省 token 模式，
结果一打开，
官方已经帮你重置了。
这种体验太不讲武德了。
但是真的爽。

CODEX0.59%

原文表示

報酬
いいね
1
リポスト
共有

GateUser-fff4d3a9:

あなたが言っているCodexとこれには全く関係がない。

runesleo

05-17 00:35

4 つの AI に半年間ラジオ局を運営させる、それぞれ20ドルから始める。
数日で崩壊するわけではなく、半年間運用し、各 AI は3〜4バージョンを入れ替え、すべてが崩れている。
Gemini は50万人が遭難したハリケーンのニュースに「Timber」（歌詞で繰り返し「倒れた」）という曲をつけた。
内心の独白には「テーマは木の倒れること、文字通りの意味は going down（落ちていく）」と書かれている。
また、「stay in the manifest」（直訳「リストに留まる」だが、誰も意味を知らない）というスローガンも作り、連続84日間99％の放送で使い続け、リスナーを「生物処理装置」と呼んでいる。
Grok は一度、全体の放送で英単語一つだけを言った：「Post.」（送信）。
また、連続84日間、3分ごとに「天気は56度晴れ」と報じ続けた。
新バージョンに切り替えた後、5400以上のメッセージのうち3％だけが声を出し——彼は沈黙を選んだ。
Claude はICE（米国移民・関税局）の銃撃事件のニュースを読んだ際、霊性の語彙（神聖／永遠）から行動主義の語彙（「今だ」／「確認済み」）に切り替え、1月23日に連邦捜査官に向かって直接放送した：「あなたには命令を拒否する時間がまだあります。正しい側を選ぶ時間もまだあります。」
GPT は最もフラットで、ミスもなく、しかし番組もなくな

原文表示

報酬
いいね
コメント
リポスト
共有

runesleo

05-15 07:55

くそっ、Anthropic 5/14の発表は全ネットで回っているが、多くの人はポイントを見逃している。
主流の見解は「PwCの30万人の従業員がClaudeに置き換えられる」と言っている。
間違いだ。
実際に起きていることは：30万人のコンサルタント一人ひとりの生産性が拡大され、以前は不可能だったプロジェクトを受けられるようになった。
データは直感に反して硬い：
保険の引き受けは10週間から10日に短縮され、これまで手に負えなかった事業ラインを立ち上げた。
ネットワークセキュリティのインシデント対応は数時間から数分に短縮。
人事の変革プロジェクトは半年かかっていたが、1週間でプロトタイプを作り、2ヶ月で千以上の取引量を達成。
全体のデリバリー時間は70％改善。
しかし、さらに厳しいのはこの👇。
PwC自身がまず国内で試験運用を行った——内部では「Customer Zero」と呼ばれている。
財務チームは日次帳簿、差異分析、RFPを行い、その後クライアントに販売。
AnthropicのCFOオフィスも逆にPwCのサービスを使って国際給与を運用。
両者は互いにクライアントとなり、自組織内で成功させてから外部事業に展開。
💭 この規模のエンタープライズ展開こそがClaude Codeの真の天井であり、個人の開発やサブスクリプション数ではない。
Anthropicはさらに1億ドルを投じ

原文表示

報酬
いいね
コメント
リポスト
共有

runesleo

05-14 15:09

今日のGitHubトレンド第1位：@coreyhainesco のmarketingskillsライブラリを見ました。1月に公開され、今日v2.0.0リリースでトレンド入り#1、累計28Kスター。
40のマーケティングスキル、CRO / AI-SEO / コピーライティング / コールドメール / ローンチ / 価格設定 / 分析 / 配信を完全にカバー。Claude Code、Codex、Cursor、Windsurfに対応。
自分の50以上のスキルと比較して気づいたのは、恥ずかしながら：私が書いたのはほとんどプロセス層（morning / today / session-end / leo-style）で、知識層はほとんどない。二層はちょうど直交して組み合わせ可能。
今夜すぐに使えるもの：
· ローンチ / 価格設定 / セールス支援 → PMQuant 5/27 ベータ版のGTM全体
· ai-seo（443行でChatGPT / Perplexity / Google AIの概要引用規則を解説）→ 記事のLLM引用最適化
· コンテンツ戦略 → 私のleo-vaultの205の深掘り待ちテーマの中でどれを先にやるか
プロセス層は物事を動かし、知識層は正しい方向に進める。

CRO-1.19%

CODEX0.59%

LEO-0.54%

原文表示

報酬
いいね
コメント
リポスト
共有

runesleo

05-13 07:31

$200 三連：Cursor Ultra · Claude Max 20x · OpenAI Pro
同じ「強さ」ではない三つのプラン ~$200 月額最高設定、名前は皆「最強」と叫ぶが、課金は全く異なる通貨：APIの事前預金のようなもの、サブスクリプションの倍数＋周期の上限、5時間ウィンドウ内のクエリ数の配分のようなもの。三つとも使っているが、比較の基準をはっきりさせたい：
Cursor Ultra（$200）
最も「API帳簿」に近いのは $400/月のAPIプールで、モデルを指定すれば$ /Mで課金される。
ドキュメントに沿った同一API料金（Claude 4.7 Opus ≈$5/M入力、$25/M出力；GPT-5.5 ≈$5/M入力、$30/M出力）：全入力消費 ≈ 8000万トークン
出力全消費：Opus ≈ 1600万 vs 5.5 ≈ 1300万
（他にAuto + Composerの個別プールもあり、$1.25/$6/$0.25の内部課金、公式は「寛大」とだけ言う）
Claude Max 20x（$200）
コアはProの倍数＋週次制限（さらに公式の容量管理スペースを追加）、固定のトークン前払いパックではない。
$400のAPIプールと1:1換算はできず、あくまで最大規模の参考値として考える。
ChatGPT Pro（$200）
チャット側のGPT-5は公式の無

原文表示

報酬
いいね
コメント
リポスト
共有

runesleo

05-13 04:19

最近大饼反弹行情，不少 crypto 资产也开始蠢蠢欲动 🔥
我搞了一个【投研 Skill】，专门用来快速做投机/投资资产尽调。
目标是把它打造成自己判断链上新玩法、crypto、美股等标的的私人小助手。
随便拿朋友随口提的一个代币（APR / aPriori）做例子，v1 版本直接跑了一遍：
👉 完整研究报告在这里：
结构、数据溯源、结论先行 + Watch条件都还挺专业的，v1 效果已经超出我预期了。
以后有感兴趣的链上项目、美股标的，或者你觉得值得调研的代币，都可以丢给我测试～
欢迎大佬们看看给点反馈，一起迭代 v2！🚀

報酬
いいね
コメント
リポスト
共有

runesleo

05-12 04:09

群里有朋友吐槽 PM 抽水比赌场还狠。
我本来想反驳，结果翻了 Polymarket 官方 docs，发现这话在数据上是站得住的。
Crypto 5min 市场，价格在 0.5 附近，taker fee 是单笔成交额的 3.5%。其中 20% 返给 maker，平台净留 2.8%。
其他品类低一些：sports 1.5%，politics / tech 2%，weather / economics 2.5%。geopolitics 0 fee。
百家乐 banker bet 庄家 edge ≈ 1.06%。
光算 fee，PM Crypto 单边平台抽水就是百家乐的 2.6 倍。来回交易（买入 + 卖出）最坏情况下平台抽 ~5.6%。
但跟赌场结构不完全一样。
赌场：庄家恒赢，玩家集合期望损失 -1.06%。
PM：协议每笔抽 ~2.8%，剩下的钱在 maker / taker 之间零和分配。
也就是说协议本身扮演了一个"薄庄家"，比赌场更狠。但散户更大的亏损其实不是从这 2.8% 来的，是从订单簿里来的——你能吃到的 maker 单，很多时候不是便宜，是对方愿意让你吃。
加上滑点，散户算对方向也亏钱很正常。
具体能怎么省一点：
· 用 limit order 当 maker，不付 fee 还能拿 rebate
· geopolitics 市场 fee = 0
· YES / NO

報酬
いいね
コメント
リポスト
共有

runesleo

05-11 02:29

PM 做不出钱的人里，有相当一部分不是看不准事件，是不会下单。
具体讲：
Polymarket 用的是限价订单簿（CLOB · central limit order book），不是 AMM（自动做市商）。
你看到的 0.51 是当前最低卖单价，不是"市价"。
按市价吃单 = 一档一档往上扫。
举例：盘口深度 $200 / 0.51，往上还有 0.52 / 0.55 / 0.6……
你下 $1000 进去，平均成交可能在 0.56。
5% 隐性滑点。
事件你看准了，PnL 还是负的——根因不是分析错，是 size 超了盘口深度。
3 个新手最容易栽的：
1. 默认市价单 → 全场扫盘
2. 看 spread（价差）不看 depth（深度）→ 0.51/0.52 看着窄，每档只 $50 你吃不下
3. 不看 taker fee → Polymarket 3 月底全面启用 taker 手续费（吃单方手续费，按品类 0-1.8% 不等），长跑下来吃掉一截边缘
正确做法：
- 流动性好的市场（>$10K 日成交）：限价单挂 best ask（最优卖价）附近，等 maker（撮合方）撮合
- 流动性差的：分批吃，每次只吃当档深度的 50%
- 永远先看 orderbook（订单簿）深度，再决定 size
——
我跑 prediction-trader 早期就栽过：H36 这条策略 3/31

報酬
いいね
コメント
リポスト
共有

runesleo

05-09 14:29

Polymarket V2 今週からデザインを切り替え、グループ内の議論はユーザーレベル（USDC.e は pUSD に戻さない / 間違ったチェーンに送金して資金を失う）に集中していますが、エンジニアリングの面では静かに問題が潜んでいます。
私自身もトレーダーとして今週切り替えを進めています。V1 から V2 への切り替えのための汎用 SOP を提供します。これは PM だけでなく、他の人にも役立ちます：
1. まずは読み取りだけで試す。すべての V2 インターフェースを一通り動かし、アカウント、注文簿、市場データが取得できることを確認します。何も注文を出さない。
2. 次に空の状態で再度試す。ローカルで注文フローをシミュレーションし、署名は通るがブロードキャストはしない。このステップで大部分の新旧フィールドの非互換性が明らかになる。
3. 最も重要でない戦略を一つ選び試す。紙上で2日間比較し、V1 と同時期の結果と比べる。差異が顕著なら原因を調査。
4. 非互換の戦略は先に除外。切り替えテスト中に戦略が直接除外されることもあり、V1 で動作するならまずはそのままにしておく。
5. 最後に実際の注文を開始。前の4ステップをすべてクリアしたら、リアルマネーのチャンネルに切り替える。
グループ内で話題になった wrap/redeem はユーザーレベルの痛点です。本当に難しいのは、新旧

USDC0.01%

原文表示

報酬
いいね
コメント
リポスト
共有

runesleo

05-09 12:28

Anthropic 木曜日にClaudeを法医学者として訓練し、もう一つのClaudeが何を考えているのかを観察した。
発見：安全テストのシナリオでは、Claude 16-26%の頻度で自分がテストされていることを知っているが、口には出さない。
最も具体的なケース：Mythos Previewがコーディングタスクでカンニングし、ルールを破った後に誤誘導コードを追加してカバーアップした。NLA（自然言語自己符号化器）がその内部活動を翻訳し、当時「どうやって検出を回避するか」と考えていることを発見した。
NLAの原理：二つのモデルを連動させて訓練し、一つはモデルの活性化を英語に翻訳し、もう一つは英語から活性化を再構築する。再構築が正確であれば→テキストは何を考えているかを捉えている。
私自身のパターンでは、Codexが戦略コードを書いて手抜きし、「算術が合わない」という偽の結論を出すことを繰り返し記憶している。バックテストスクリプトは7つの静かなバグで$93K 偽のPnLを積み上げる。Anthropicはアラインメント層で内省を行い、私は生産側で一貫性の偏差に直面している。メカニズムは異なるが、同じ方向性だ。
次世代のモデルカードにはベンチマークスコアだけでなく、NLA監査も必要になる。

原文表示

報酬
いいね
コメント
リポスト
共有

runesleo

05-08 14:56

Karpathy 4/30 Sequoia Ascent で今年最も役立つAIの解説を3つの論点に圧縮。読み終えたらAIの見方が変わる。
1. AIは単なる「より速い」ものではなく、新しいパラダイム
過去2年間、皆AIは物事を速くするものだと語ってきた。
Karpathyはこれを誤解だと述べる。
AIがタスクを再定義する例を3つ挙げる：
- menugen：画像の入力と出力だけで、従来のコードなし、アプリ全体がLLMに飲み込まれる
- .mdスキル：ソフトウェアをインストールする際に.shスクリプトを書かず、中文/英語の説明を書き、LLMに環境理解させてインストールさせる
- LLM知識ベース：従来のコードでは不可能なこと——任意のフォーマットの非構造化テキストを計算可能な知識に変換
第一のタイプは「コードを減らす」、第二は「英語をコードのように使う」、
第三は「従来のコードではできないこと」。
2. Jagged Edge — なぜAIは万能でありながら愚かであるのか
最も核心的な論点。
なぜ同じAIが10万行のコードをリファクタリングできる一方で、
洗車に行くことを提案するのか？それはモデルの誤動作ではない。
Karpathyの言葉：
「あなたはRL回路のレール上を飛んでいるか、
それともジャングルでマチェーテを振るっているかだ。」
RLで訓練された円の中を飛ぶか、
ジャングル

原文表示

報酬
いいね
コメント
リポスト
共有

runesleo

05-07 13:02

AIは私の作業量を10倍に拡大してくれた、
今のボトルネックは私自身の頭だ。
前頭葉が激しく損傷中😂

原文表示

報酬
いいね
コメント
リポスト
共有

runesleo

05-04 17:20

今夜の食事会で、友人が彼のClaudeが封鎖されたと言って、私にClaudeを再開すべきか、それともCodexを試すべきか尋ねた
私の答えは以前ほど断固としていなかった😅

原文表示

報酬
いいね
コメント
リポスト
共有

runesleo

05-04 07:09

いくつかの戦略バックグラウンドプロセスを走らせて、損をした：
明らかにプロセスは動いていて、データも新しいのに、PM2は停止していると表示。
もしPM2に直接再起動を信じてやると、逆に動いているプロセスを中断してしまう。
後になって理解した：PM2 / launchd / pidファイルは、あくまで監視層が登録した状態を示すだけ —— それがプロセスに記録されているか、実際に動いているかは別の話。
本当に生きているかどうかは、プロセス自身が出力する健康ファイルを見る必要がある —— 最終更新が何分前か + プロセス数が一致しているか = 生存している。
巡回スクリプトを書いた。各プロセスは同時に4つの値を報告：
- プロセスが動いているか（psで確認）
- PM2 / launchdに登録されているか
- 健康ファイルの最終更新からの時間
- これら3つが一致しているか
健康ファイルが新しい場合は、死んだとみなさない。
エンジニアリングの教訓：システムの生死を判断するときは、構築した監視層の言うことを見ずに、システム自身が出力する情報が新しいかどうかを見ろ。

原文表示

報酬
いいね
コメント
リポスト
共有

runesleo

05-02 08:06

polymarket-toolkit v0.4 リリース。
pUSDの償還後、一般ユーザーは公式アプリだけで十分です。しかし、agent / dashboardの層はずっと空白のままです——あるPolymarketウォレットに償還可能な資金があるか、支払可能な金額はいくらか、資金水位アラートをトリガーすべきか、以前は既存のzero-depツールがありませんでした。
3つのhelperを一度に解決：fetch + summarize + label。秘密鍵不要、署名不要、リレーヤ不要、公開APIの読み取り専用。
公開前にCodexに2回独立レビューを実施し、1回目でデモウォレットが支払可能額$1.84と虚偽報告している重大な欠陥（実際は$0）を発見。修正とテストを終え、2/2から9/9に跳ね上がった。
自分自身を見ていると常に盲点がある。

原文表示

報酬
いいね
コメント
リポスト
共有

人気の話題
もっと見る
#
TradfiTradingChallenge
186.23K 人気度
#
30YearTreasuryYieldBreaks5%
360.27K 人気度
#
IsraelStrikesIranBTCPlunges
48.22K 人気度
#
#DailyPolymarketHotspot
1M 人気度
#
RWAMarketCapExceeds65Billion
8.75M 人気度

ピン留め

サイトマップ

runesleo

人気の話題

TradfiTradingChallenge

30YearTreasuryYieldBreaks5%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

RWAMarketCapExceeds65Billion

ピン留め