Deepseek on knowledged.to

Deepseek on knowledged.tohttps://knowledged.to/tags/deepseek/Recent content in Deepseek on knowledged.toHugoen-usThu, 21 May 2026 22:20:05 +0530LLM Prompt Cache Options Across Providershttps://knowledged.to/notes/ml/llm-prompt-cache-provider-options/Thu, 21 May 2026 16:49:20 +0000https://knowledged.to/notes/ml/llm-prompt-cache-provider-options/Compares prompt/KV cache TTLs, controls, pricing, scope, and strategies across major LLM providers.GRPO — Group Relative Policy Optimizationhttps://knowledged.to/notes/ml/grpo-group-relative-policy-optimization/Tue, 19 May 2026 17:17:58 +0000https://knowledged.to/notes/ml/grpo-group-relative-policy-optimization/Critic-free RL algorithm that replaces PPO's value model with group-relative rewards for LLM fine-tuning.