Visió general

El model té dues peces que s'estimen conjuntament. La primera explica si una colla carrega i/o descarrega un castell donat el seu nivell actual i la dificultat del castell (pota d'èxit). La segona explica quin castell decideix intentar cada colla cada mes, tot tenint en compte que les colles tendeixen a intentar castells d'una dificultat propera al seu nivell (pota de tria). Tots els paràmetres —trajectòries temporals de nivell, llindars de dificultat i preferències de tria— s'estimen per MCMC a partir dels registres històrics d'actuacions.

Siguin \(i = 1,\ldots,N\) les colles i \(h = 1,\ldots,H\) les estructures de castell. Cada intent s'indexa per la tupla \((i, h, t)\), on \(t\) és el mes d'actuació. El resultat observable és una variable ordinal \(Y \in \{0,1,2\}\): \(0 =\) intent (no carregat), \(1 =\) carregat, \(2 =\) descarregat.

La log-posterior conjunta és \[ \begin{aligned} \log p(\mathbf{q}, \mathbf{d}, s, \boldsymbol{\beta}, \boldsymbol{\alpha} \mid \mathcal{D}) &= \underbrace{\log p_{\text{èxit}}(\mathcal{D}\mid\mathbf{q},\mathbf{d})}_{\text{pota d'èxit}} + \underbrace{\log p_{\text{tria}}(\mathcal{D}\mid\mathbf{q},\mathbf{d},\boldsymbol{\beta},\boldsymbol{\alpha})}_{\text{pota de tria}} \\ &\quad + \log p(\mathbf{q}\mid s) + \log p(\mathbf{d}) + \log p(s) + \log p(\boldsymbol{\beta}) + \log p(\boldsymbol{\alpha}), \end{aligned} \] on \(\mathcal{D} = \{(i,h,t,Y)\}\) és el conjunt d'intents observats.

Pota d'èxit (model ordinal)

Per a cada intent, el model assigna una probabilitat a cadascun dels tres resultats possibles (intent, carregat, descarregat) en funció de com de bona és la colla (\(q_i(t)\), el seu nivell) i de com de difícil és el castell (\(d_c[h]\) per carregar-lo, \(d_d[h]\) per descarregar-lo). Si el nivell és molt per sobre del llindar de dificultat, el resultat probable és descarregat; si és just a l'altura, probablement carregat; si és per sota, intent.

Versemblança ordinal acumulada (cumulative logit)

Cada estructura \(h\) té dos llindars en l'eix de nivell: \(d_c[h] \le d_d[h]\). El resultat \(Y\) segueix un model ordinal acumulat: \[ P(Y \ge 1 \mid q, h) = \sigma\!\bigl(q_i(t) - d_c[h]\bigr), \qquad P(Y \ge 2 \mid q, h) = \sigma\!\bigl(q_i(t) - d_d[h]\bigr), \] on \(\sigma(x) = (1+e^{-x})^{-1}\) és la funció sigmoide. Les probabilitats de categoria són: \[ P(Y = 0) = \sigma(d_c[h] - q_i(t)), \qquad P(Y = 1) = \sigma(q_i(t) - d_c[h]) - \sigma(q_i(t) - d_d[h]), \qquad P(Y = 2) = \sigma(q_i(t) - d_d[h]). \] La restricció \(d_c[h] \le d_d[h]\) garanteix \(P(Y=1) \ge 0\). La log-versemblança per a un intent \((i,h,t,Y)\) és simplement \(\log P(Y \mid q_i(t), d_c[h], d_d[h])\), i la contribució total és la suma sobre tots els intents.

Prior per al nivell de les colles: random walk

El nivell de cada colla evoluciona com un random walk Gaussià discret: \[ q_i(0) \sim \mathrm{Exp}(\text{escala}=5), \quad 0 \le q_i(0) \le q_{\max}, \] \[ q_i(t) \mid q_i(t-1),\, s \;\sim\; \mathcal{N}\!\bigl(q_i(t-1),\, s\bigr), \quad t = 1, 2, \ldots, T, \] truncat a \([0, q_{\max}]\). El paràmetre \(s > 0\) controla la volatilitat mensual del nivell i és compartit per totes les colles.

Prior per a la volatilitat del nivell

\[ s \sim \mathrm{Exp}(\text{escala} = s_c), \quad s > 0, \] amb \(s_c = 0.5\) per defecte. Un \(s\) petit implica trajectòries suaus; un \(s\) gran permet canvis bruscos de nivell.

Prior per als llindars de dificultat

La distribució a priori per als dos llindars de cada estructura és uniforme sobre el triangle \(\{(d_c, d_d) : 0 \le d_c \le d_d \le q_{\max}\}\) multiplicada per un factor log-normal sobre la ràtio \(r_h = d_d[h]/d_c[h]\): \[ \log r_h \;\sim\; \mathcal{N}\!\bigl(\log \mu_r,\, \sigma_r^2\bigr), \] amb \(\mu_r = 1.04\) i \(\sigma_r \approx 0.019\) (correspon a \(\sigma_r = 0.02/1.04\) en escala log). El factor log-normal evita que per a castells poc intentats el sampler empeny \(d_c\) i \(d_d\) allunyats mentre manté fix el seu punt mig (que és el que observa la pota de tria).

Pota de tria (model de selecció)

Les colles no proven castells a l'atzar: tendeixen a intentar castells adequats al seu nivell. El model captura aquest biaix assignant una utilitat a cada castell en funció de com de a prop queda la seva dificultat del nivell de la colla aquell mes. La probabilitat de triar un castell concret ve donada per un softmax sobre tots els castells del catàleg. L'asimetria del model (paràmetre \(\beta_-\)) captura que les colles eviten més els castells massa difícils que els massa fàcils.

Funció d'utilitat

Per a la colla \(i\) al mes \(t\), l'estructura \(h\) rep una utilitat \[ u_{iht} = \alpha_h + f_\phi\!\bigl(q_i(t) - D_h\bigr), \] on \(D_h = \tfrac{1}{2}(d_c[h] + d_d[h])\) és el punt mig dels llindars de l'estructura, \(\alpha_h\) és una constant específica de l'alternativa (ASC) que absorbeix diferències de popularitat independents del nivell, i \[ f_\phi(\delta) = \begin{cases} \beta_+ |\delta| & \text{si } \delta \ge 0, \\ \beta_- |\delta| & \text{si } \delta < 0, \end{cases} \qquad \beta_- \le \beta_+ \le 0. \] La funció \(f_\phi\) és una rampa en V centrada a \(\delta = 0\) (nivell = dificultat) que decau linealment a banda i banda; el factor \(\exp(f_\phi)\) és una distribució de Laplace biasimètrica sobre \(\delta\). La condició \(\beta_- \le \beta_+\) (amb tots dos negatius) implica que la penalització és més forta quan la colla és per sota de la dificultat del castell (\(\delta < 0\)) que quan és per sobre.

Softmax (multinomial logit)

La probabilitat de triar l'estructura \(h\) donada la colla \(i\) al mes \(t\) és \[ \pi_{it}(h) = \frac{\exp(u_{iht})}{\displaystyle\sum_{h'=1}^{H} \exp(u_{ih't})}, \] i la contribució a la log-versemblança és \(\log \pi_{it}(h_{\text{obs}})\), on \(h_{\text{obs}}\) és l'estructura efectivament intentada.

Prior per als pendents de la funció d'utilitat

Reparametritzant com \(r = -\beta_+ \ge 0\) (escala de la rampa) i \(\gamma = \beta_+ - \beta_- \ge 0\) (asimetria), s'imposen priors exponencials independents: \[ r \sim \mathrm{Exp}(\text{escala} = 0.5), \qquad \gamma \sim \mathrm{Exp}(\text{escala} = 5). \] Qualsevol proposta amb \(\beta_+ > 0\) o \(\beta_- > \beta_+\) és rebutjada.

Prior per a les constants específiques d'alternativa

El softmax és invariant a un desplaçament global de tots els \(\alpha_h\), de manera que calen dos ancoratges per a la identificabilitat:

  • Ancoratge de \(d\): un únic llindar de referència és fixat a un valor numèric (per convenció, \(d_d[\text{4de8}] = 8.0\)), la qual cosa elimina la degenerescència de desplaçament global en \((q, d)\).
  • Ancoratge de \(\alpha\): \(\alpha_{h^*} = 0\) per a l'estructura de referència \(h^*\). Aquest ancoratge fixa l'origen de l'escala de popularitats, de manera que \(\exp(\alpha_h)\) s'interpreta com la popularitat intrínseca de l'estructura \(h\) relativa a la de referència (per a la qual val \(1\) per construcció).

Sobre les entrades lliures \(\alpha_h\) (\(h \ne h^*\)) s'imposa una llei a priori de Laplace asimètrica, en línia amb la forma empírica observada (asimetria marcada, amb la majoria d'estructures menys populars que la de referència). En escala logarítmica, \[ \log p(\alpha_h) \;=\; \begin{cases} -\,(\alpha_h - m)/\lambda_+ & \text{si } \alpha_h \ge m, \\[2pt] \phantom{-\,}(\alpha_h - m)/\lambda_- & \text{si } \alpha_h < m, \end{cases} \] és a dir una funció en V centrada al mode \(m\), amb decaïments exponencials diferents a banda i banda. Els valors per defecte són \[ m = -1, \qquad \lambda_- = 2.0, \qquad \lambda_+ = 0.7, \] que situen el mode a una popularitat relativa \(\exp(m) \approx 0.37\), i deixen com a extrems plausibles (a ~3.5 % de massa a cada cua) els valors \(\alpha_h \approx -7\) (estructures molt menys populars) i \(\alpha_h \approx +0.4\) (estructures lleugerament més populars que la de referència). El prior és feblement informatiu: regularitza les entrades amb pocs intents cap al mode sense afectar les ben identificades.

Consideracions addicionals

Més enllà de les dues potes principals, el model incorpora tres consideracions addicionals: (1) un ordre parcial sobre les dificultats dels castells que reflecteix el coneixement tècnic previ, (2) un prior sobre la ràtio de dificultat carregat-descarregat que evita solucions degenerades per a castells poc intentats, i (3) l'ancoratge de l'escala global de \(q\) i \(d\) mitjançant un llindar de referència fix.

1. Ordre parcial de dificultats

Es disposa d'un conjunt de parells \(\mathcal{O}\) de restriccions de la forma «el castell \(h_1\) és més fàcil que \(h_2\)», derivades de la progressió natural de les estructures castelleres (e.g. 4de7 és més fàcil que 4de8; una estructura sense folre és més difícil que la mateixa amb folre). Per a cada parell \((h_1, h_2) \in \mathcal{O}\): \[ d_c[h_1] \le d_c[h_2] \quad \text{i} \quad d_d[h_1] \le d_d[h_2]. \] Qualsevol proposta que violi algun d'aquests parells és rebutjada (\(\log p = -\infty\)).

2. Prior sobre la ràtio carregat-descarregat

Empíricament, la ràtio entre els llindars de descarregat i carregat dels castells ben mostrejats és propera a \(1.04\) (descarregar costa un \(4\%\) addicional en escala log-odds respecte a carregar). Per a castells poc intentats —especialment aquells que mai s'han descarregat— la versemblança pot ser compatible amb ràtios molt grans, cosa que genera traçes poc fiables. El prior log-normal sobre \(\log r_h\) vist a la secció anterior regularitza aquest comportament sense fixar la ràtio.

3. Ancoratge de l'escala global

La versemblança de la pota d'èxit depèn únicament de les diferències \(q_i(t) - d_c[h]\) i \(q_i(t) - d_d[h]\); per tant, un desplaçament global \(q \to q + c\), \(d \to d + c\) no modifica cap terme de versemblança. Per fixar l'escala es pinja un llindar: \(d_d[\text{4de8}] = 8.0\), que és consistent amb el nombre de pisos de l'estructura de referència i amb la calibració per mínims quadrats ponderats \(d \approx \log_{10}(\text{puntuació})\). Un cop fixat aquest ancoratge, la interpretació numèrica de \(q_i(t)\) és la puntuació (en pisos o en unitats comparables) del nivell de la colla en aquell mes.

Resum de paràmetres i distribucions a priori

Paràmetre Descripció Prior
\(q_i(0)\) Nivell inicial de la colla \(i\) \(\mathrm{Exp}(\text{escala}=5)\), \(q_i(0)\in[0,q_{\max}]\)
\(q_i(t)\mid q_i(t-1), s\) Evolució mensual del nivell \(\mathcal{N}(q_i(t-1), s)\), \(q_i(t)\in[0,q_{\max}]\)
\(s\) Volatilitat del random walk \(\mathrm{Exp}(\text{escala}=s_c=0.5)\), \(s>0\)
\((d_c[h], d_d[h])\) Llindars carregat / descarregat de l'estructura \(h\) Uniforme sobre el triangle \(0 \le d_c \le d_d \le q_{\max}\) × log-normal sobre \(r_h\)
\(\beta_+, \beta_-\) Pendents de la funció d'utilitat de tria \(-\beta_+ \sim \mathrm{Exp}(0.5)\), \(\beta_+-\beta_- \sim \mathrm{Exp}(5)\)
\(\alpha_h\) Constants específiques d'alternativa (popularitat intrínseca, \(\exp\alpha_h\)) Laplace asimètrica amb mode \(m=-1\), escales \(\lambda_-=2.0\), \(\lambda_+=0.7\); \(\alpha_{h^*}=0\) fix