El model estadístic
Descripció completa del model probabilístic bayesià que fonamenta les estimacions i prediccions d'aquesta web. Inclou la part de resultat (pota d'èxit) i la part de tria (pota de selecció de castell), les lleis a priori i les restriccions de dificultat.
Visió general
Siguin \(i = 1,\ldots,N\) les colles i \(h = 1,\ldots,H\) les estructures de castell. Cada intent s'indexa per la tupla \((i, h, t)\), on \(t\) és el mes d'actuació. El resultat observable és una variable ordinal \(Y \in \{0,1,2\}\): \(0 =\) intent (no carregat), \(1 =\) carregat, \(2 =\) descarregat.
La log-posterior conjunta és \[ \begin{aligned} \log p(\mathbf{q}, \mathbf{d}, s, \boldsymbol{\beta}, \boldsymbol{\alpha} \mid \mathcal{D}) &= \underbrace{\log p_{\text{èxit}}(\mathcal{D}\mid\mathbf{q},\mathbf{d})}_{\text{pota d'èxit}} + \underbrace{\log p_{\text{tria}}(\mathcal{D}\mid\mathbf{q},\mathbf{d},\boldsymbol{\beta},\boldsymbol{\alpha})}_{\text{pota de tria}} \\ &\quad + \log p(\mathbf{q}\mid s) + \log p(\mathbf{d}) + \log p(s) + \log p(\boldsymbol{\beta}) + \log p(\boldsymbol{\alpha}), \end{aligned} \] on \(\mathcal{D} = \{(i,h,t,Y)\}\) és el conjunt d'intents observats.
Pota d'èxit (model ordinal)
Versemblança ordinal acumulada (cumulative logit)
Cada estructura \(h\) té dos llindars en l'eix de nivell: \(d_c[h] \le d_d[h]\). El resultat \(Y\) segueix un model ordinal acumulat: \[ P(Y \ge 1 \mid q, h) = \sigma\!\bigl(q_i(t) - d_c[h]\bigr), \qquad P(Y \ge 2 \mid q, h) = \sigma\!\bigl(q_i(t) - d_d[h]\bigr), \] on \(\sigma(x) = (1+e^{-x})^{-1}\) és la funció sigmoide. Les probabilitats de categoria són: \[ P(Y = 0) = \sigma(d_c[h] - q_i(t)), \qquad P(Y = 1) = \sigma(q_i(t) - d_c[h]) - \sigma(q_i(t) - d_d[h]), \qquad P(Y = 2) = \sigma(q_i(t) - d_d[h]). \] La restricció \(d_c[h] \le d_d[h]\) garanteix \(P(Y=1) \ge 0\). La log-versemblança per a un intent \((i,h,t,Y)\) és simplement \(\log P(Y \mid q_i(t), d_c[h], d_d[h])\), i la contribució total és la suma sobre tots els intents.
Prior per al nivell de les colles: random walk
El nivell de cada colla evoluciona com un random walk Gaussià discret: \[ q_i(0) \sim \mathrm{Exp}(\text{escala}=5), \quad 0 \le q_i(0) \le q_{\max}, \] \[ q_i(t) \mid q_i(t-1),\, s \;\sim\; \mathcal{N}\!\bigl(q_i(t-1),\, s\bigr), \quad t = 1, 2, \ldots, T, \] truncat a \([0, q_{\max}]\). El paràmetre \(s > 0\) controla la volatilitat mensual del nivell i és compartit per totes les colles.
Prior per a la volatilitat del nivell
\[ s \sim \mathrm{Exp}(\text{escala} = s_c), \quad s > 0, \] amb \(s_c = 0.5\) per defecte. Un \(s\) petit implica trajectòries suaus; un \(s\) gran permet canvis bruscos de nivell.
Prior per als llindars de dificultat
La distribució a priori per als dos llindars de cada estructura és uniforme sobre el triangle \(\{(d_c, d_d) : 0 \le d_c \le d_d \le q_{\max}\}\) multiplicada per un factor log-normal sobre la ràtio \(r_h = d_d[h]/d_c[h]\): \[ \log r_h \;\sim\; \mathcal{N}\!\bigl(\log \mu_r,\, \sigma_r^2\bigr), \] amb \(\mu_r = 1.04\) i \(\sigma_r \approx 0.019\) (correspon a \(\sigma_r = 0.02/1.04\) en escala log). El factor log-normal evita que per a castells poc intentats el sampler empeny \(d_c\) i \(d_d\) allunyats mentre manté fix el seu punt mig (que és el que observa la pota de tria).
Pota de tria (model de selecció)
Funció d'utilitat
Per a la colla \(i\) al mes \(t\), l'estructura \(h\) rep una utilitat \[ u_{iht} = \alpha_h + f_\phi\!\bigl(q_i(t) - D_h\bigr), \] on \(D_h = \tfrac{1}{2}(d_c[h] + d_d[h])\) és el punt mig dels llindars de l'estructura, \(\alpha_h\) és una constant específica de l'alternativa (ASC) que absorbeix diferències de popularitat independents del nivell, i \[ f_\phi(\delta) = \begin{cases} \beta_+ |\delta| & \text{si } \delta \ge 0, \\ \beta_- |\delta| & \text{si } \delta < 0, \end{cases} \qquad \beta_- \le \beta_+ \le 0. \] La funció \(f_\phi\) és una rampa en V centrada a \(\delta = 0\) (nivell = dificultat) que decau linealment a banda i banda; el factor \(\exp(f_\phi)\) és una distribució de Laplace biasimètrica sobre \(\delta\). La condició \(\beta_- \le \beta_+\) (amb tots dos negatius) implica que la penalització és més forta quan la colla és per sota de la dificultat del castell (\(\delta < 0\)) que quan és per sobre.
Softmax (multinomial logit)
La probabilitat de triar l'estructura \(h\) donada la colla \(i\) al mes \(t\) és \[ \pi_{it}(h) = \frac{\exp(u_{iht})}{\displaystyle\sum_{h'=1}^{H} \exp(u_{ih't})}, \] i la contribució a la log-versemblança és \(\log \pi_{it}(h_{\text{obs}})\), on \(h_{\text{obs}}\) és l'estructura efectivament intentada.
Prior per als pendents de la funció d'utilitat
Reparametritzant com \(r = -\beta_+ \ge 0\) (escala de la rampa) i \(\gamma = \beta_+ - \beta_- \ge 0\) (asimetria), s'imposen priors exponencials independents: \[ r \sim \mathrm{Exp}(\text{escala} = 0.5), \qquad \gamma \sim \mathrm{Exp}(\text{escala} = 5). \] Qualsevol proposta amb \(\beta_+ > 0\) o \(\beta_- > \beta_+\) és rebutjada.
Prior per a les constants específiques d'alternativa
El softmax és invariant a un desplaçament global de tots els \(\alpha_h\), de manera que calen dos ancoratges per a la identificabilitat:
- Ancoratge de \(d\): un únic llindar de referència és fixat a un valor numèric (per convenció, \(d_d[\text{4de8}] = 8.0\)), la qual cosa elimina la degenerescència de desplaçament global en \((q, d)\).
- Ancoratge de \(\alpha\): \(\alpha_{h^*} = 0\) per a l'estructura de referència \(h^*\). Aquest ancoratge fixa l'origen de l'escala de popularitats, de manera que \(\exp(\alpha_h)\) s'interpreta com la popularitat intrínseca de l'estructura \(h\) relativa a la de referència (per a la qual val \(1\) per construcció).
Sobre les entrades lliures \(\alpha_h\) (\(h \ne h^*\)) s'imposa una llei a priori de Laplace asimètrica, en línia amb la forma empírica observada (asimetria marcada, amb la majoria d'estructures menys populars que la de referència). En escala logarítmica, \[ \log p(\alpha_h) \;=\; \begin{cases} -\,(\alpha_h - m)/\lambda_+ & \text{si } \alpha_h \ge m, \\[2pt] \phantom{-\,}(\alpha_h - m)/\lambda_- & \text{si } \alpha_h < m, \end{cases} \] és a dir una funció en V centrada al mode \(m\), amb decaïments exponencials diferents a banda i banda. Els valors per defecte són \[ m = -1, \qquad \lambda_- = 2.0, \qquad \lambda_+ = 0.7, \] que situen el mode a una popularitat relativa \(\exp(m) \approx 0.37\), i deixen com a extrems plausibles (a ~3.5 % de massa a cada cua) els valors \(\alpha_h \approx -7\) (estructures molt menys populars) i \(\alpha_h \approx +0.4\) (estructures lleugerament més populars que la de referència). El prior és feblement informatiu: regularitza les entrades amb pocs intents cap al mode sense afectar les ben identificades.
Consideracions addicionals
1. Ordre parcial de dificultats
Es disposa d'un conjunt de parells \(\mathcal{O}\) de restriccions de la forma «el castell \(h_1\) és més fàcil que \(h_2\)», derivades de la progressió natural de les estructures castelleres (e.g. 4de7 és més fàcil que 4de8; una estructura sense folre és més difícil que la mateixa amb folre). Per a cada parell \((h_1, h_2) \in \mathcal{O}\): \[ d_c[h_1] \le d_c[h_2] \quad \text{i} \quad d_d[h_1] \le d_d[h_2]. \] Qualsevol proposta que violi algun d'aquests parells és rebutjada (\(\log p = -\infty\)).
2. Prior sobre la ràtio carregat-descarregat
Empíricament, la ràtio entre els llindars de descarregat i carregat dels castells ben mostrejats és propera a \(1.04\) (descarregar costa un \(4\%\) addicional en escala log-odds respecte a carregar). Per a castells poc intentats —especialment aquells que mai s'han descarregat— la versemblança pot ser compatible amb ràtios molt grans, cosa que genera traçes poc fiables. El prior log-normal sobre \(\log r_h\) vist a la secció anterior regularitza aquest comportament sense fixar la ràtio.
3. Ancoratge de l'escala global
La versemblança de la pota d'èxit depèn únicament de les diferències \(q_i(t) - d_c[h]\) i \(q_i(t) - d_d[h]\); per tant, un desplaçament global \(q \to q + c\), \(d \to d + c\) no modifica cap terme de versemblança. Per fixar l'escala es pinja un llindar: \(d_d[\text{4de8}] = 8.0\), que és consistent amb el nombre de pisos de l'estructura de referència i amb la calibració per mínims quadrats ponderats \(d \approx \log_{10}(\text{puntuació})\). Un cop fixat aquest ancoratge, la interpretació numèrica de \(q_i(t)\) és la puntuació (en pisos o en unitats comparables) del nivell de la colla en aquell mes.
Resum de paràmetres i distribucions a priori
| Paràmetre | Descripció | Prior |
|---|---|---|
| \(q_i(0)\) | Nivell inicial de la colla \(i\) | \(\mathrm{Exp}(\text{escala}=5)\), \(q_i(0)\in[0,q_{\max}]\) |
| \(q_i(t)\mid q_i(t-1), s\) | Evolució mensual del nivell | \(\mathcal{N}(q_i(t-1), s)\), \(q_i(t)\in[0,q_{\max}]\) |
| \(s\) | Volatilitat del random walk | \(\mathrm{Exp}(\text{escala}=s_c=0.5)\), \(s>0\) |
| \((d_c[h], d_d[h])\) | Llindars carregat / descarregat de l'estructura \(h\) | Uniforme sobre el triangle \(0 \le d_c \le d_d \le q_{\max}\) × log-normal sobre \(r_h\) |
| \(\beta_+, \beta_-\) | Pendents de la funció d'utilitat de tria | \(-\beta_+ \sim \mathrm{Exp}(0.5)\), \(\beta_+-\beta_- \sim \mathrm{Exp}(5)\) |
| \(\alpha_h\) | Constants específiques d'alternativa (popularitat intrínseca, \(\exp\alpha_h\)) | Laplace asimètrica amb mode \(m=-1\), escales \(\lambda_-=2.0\), \(\lambda_+=0.7\); \(\alpha_{h^*}=0\) fix |